German declension: modifiers

2019-05-03 22:13 -0300. Tags: lang, german, in-english

I've been dabbling in German again, and trying to learn the declensions for the articles, adjectives and other modifiers. These are some notes I made in the process.

The tables below are colorized with JavaScript. If they don't get colorized properly for you, please notify me. If you find mistakes in the text, please notify me too.

Genders, cases and numbers

German has three genders (masculine, feminine, neuter), and two numbers (singular and plural). There is a single plural declension for all genders, so, for didactical purposes, we can think of plural as a fourth gender.

German has four cases (nominative, accusative, dative, genitive), which indicate the role of the noun phrase in the sentence. In general lines:

  • Nominative is used for the subject of the sentence (the dog sees the cat). It is also the 'default' form of nouns you will find in the dictionary.
  • Accusative is used for the object of the sentence (the dog sees the cat).
  • Dative is used for the indirect object of the sentence (the boy gave the girl a book).
  • Genitive is used for possessives (the girl's book) and similar situations of nouns modifying nouns.

All cases but the nominative are also used as objects of certain prepositions. Each preposition defines which case it wants its object to appear in. Spatial prepositions typically take the dative to indicate place and the accusative to indicate movement:

  • Dative: im Wald (= in dem Wald) "in the forest"
  • Accusative: in den Wald "into the forest"

In the tables in this text, genders will appear in the order masculine, neuter, feminine, plural. This is not the usual order they are presented, but masculine and neuter often have similar forms, and so do feminine and plural. I chose this order to leave similar forms close to each other. The order of cases was also chosen for similar reasons.

The definite article

The definite article forms in the nominative are: masculine der, neuter das, feminine die, plural die. It took me a while to memorize which gender is which form, until I realized:

  • der is similar to er (he).
  • die is similar to sie (she).
  • die can also be plural, and so can sie (they).
  • das ends in -s like es (it). It is also cognate to English that and the Icelandic third person neuter pronoun það. (I realize that a comparison to Icelandic is not exactly the best mnemonic device in the world, but it works for me.)

The declined forms are:
  Masc. Neut. Fem. Plural
Nom. der das die die
Acc. den das die die
Dat. dem dem der den
Gen. des des der der

There are a lot of patterns to observe here, and they will often apply to other parts of the declension system too:

  • Masculine is the only gender that distinguishes nominative from accusative; the other genders always have the same form for both.
  • Masculine and neuter have the same dative and the same genitive.
  • Feminine uses one single form for the nominative and accusative, and another single form for dative and genitive.
  • German has a general fixation with the idea of having an -n in the dative plural. This applies to nouns too (e.g., den Kindern "to the children"), except nouns whose plural ends in -s like Autos. Other than that, the article is the same for feminine and for plural.

The indefinite article (ein)

At this point I would like to present the declension for the indefinite article (ein). The problem is that it does not have a plural, so the table would not show all the forms I want to show. Instead, I will present the declension table for kein, which is the same except it has a plural.
  Masc. Neut. Fem. Plural
Nom. kein kein keine keine
Acc. keinen kein keine keine
Dat. keinem keinem keiner keinen
Gen. keines keines keiner keiner

Many of the patterns repeat themselves here.

  • Masculine is the only gender with distinct nominative and accusative forms.
  • The masculine nominative has no ending, but the endings for the other cases are the same as those of the definite article (accusative -en, dative -em, genitive -es).
  • The neuter nominative has no ending either (and neither does the accusative; remember that the genders other than masculine don't distinguish nominative and accusative), but the dative and genitive are again like the definite article, and the same as the masculine.
  • The endings for feminine and plural are also similar to the definite article: feminine has -e in nominative and accusative, -er in dative and genitive. Dative plural again has its characteristic -n, but otherwise it's the same as the feminine.

There are three places in the table where kein has no ending: the masculine nominative and the neuter nominative and accusative. These three places will be important later.


German adjectives have three different kinds of declension:

  • The strong declension is used when the adjective is not preceded by an article or other determiner.
  • The weak declension is used when the adjective is preceded by the definite article.
  • The mixed declension is used when the adjective is preceded by the indefinite article and the possessive determiners (mein, etc.).

In the following tables, we will use the adjective groß (big, large) as an example.

Strong declension

  Masc. Neut. Fem. Plural
Nom. großer großes große große
Acc. großen großes große große
Dat. großem großem großer großen
Gen. großen großen großer großer

The endings look a lot like those of the indefinite article, with some important differences.

  • Remember those three places where kein had no ending? In these places, the strong adjective declension has the same endings as the definite article:
    • großer (like der) in the masculine nominative,
    • großes (like das) in the neuter nominative/accusative.
  • The other difference is that the masculine and neuter genitive ending is -en, not -es.

Otherwise, all the patterns repeat themselves here.

Weak declension

The weak declension is used with the definite article. Actually, to quote Wikipedia, "weak declension is used when the article itself clearly indicates case, gender, and number". It is used not only with the definite article, but also with other determiners like welcher (which), solcher (such), dieser (this), aller (all).
  Masc. Neut. Fem. Plural
Nom. der große das große die große die großen
Acc. den großen das große die große die großen
Dat. dem großen dem großen der großen den großen
Gen. des großen des großen der großen der großen

Most of the endings are -en in the weak declension. The exceptions (which have -e instead) are:

  • The same three places where kein has no ending: the masculine nominative and neuter nominative and accusative.
    • Masculine always has distinct forms for nominative and accusative, so that's not much of a surprise.
  • The feminine nominative and accusative. The feminine always has one form for nominative and accusative, and one form for the dative and genitive.

Mixed declension

The mixed declension is used with the indefinite article and the possessive determiners.
  Masc. Neut. Fem. Plural
Nom. ein großer ein großes eine große keine großen
Acc. einen großen ein großes eine große keine großen
Dat. einem großen einem großen einer großen keinen großen
Gen. eines großen eines großen einer großen keine großen

The mixed declension is identical to the weak declension, except at those three places where kein has no ending: masculine nominative and neuter nominative and accusative. In those places, it has the strong declension endings instead (-er for masculine nominative, and -es for neuter nominative and accusative).

You can think of it as the adjective having the strong endings to compensate for the lack of endings of the article in those cases, e.g., because masculine nominative ein has no ending, the großer following it gets more distinctive endings.

Trivia etymologica #4: puxar, push, empurrar

2019-02-08 01:27 -0200. Tags: lang, etymology

Pois já fazia um tempo que eu andava intrigado com as palavras puxar, push e empurrar:

[Imagem: Instruções de saída de emergência de ônibus. Português: 'Saída de emergência: Puxe a alavanca e empurre a janela'. Espanhol: 'Salida de emergencia: Tire y empuje la ventana'. Inglês: 'Emergency exit: Pull down the lever and push the window'.]

A fonte de todo o questionamento

Pois acontece, imaginem vocês, que todas essas palavras são cognatas.

puxar vem do latim pulso, pulsare, que significa, entre outras coisas, "empurrar". (Da mesma raiz derivam também impulso, expulso, propulsão, repulsa, além de, obviamente, pulsar.) Em algum momento, a palavra inverteu de sentido até chegar no português; quando e como isso aconteceu fica sugerido como exercício para o leitor. A mesma palavra dá origem em espanhol à palavra pujar, que significa "fazer esforço, empurrar", entre outros sentidos.

De impulso, impulsare (in + pulsare) deriva a palavra empujar em espanhol. Aparentemente a palavra empuxar também existe em português, de onde deriva empuxo, com o signficado original de algo que empurra. Não contente com o vocábulo nativo, entretanto, o português posteriormente importa o empujar do espanhol como empurrar.

Finalmente, push é derivado do francês medieval pousser, do francês antigo poulser, do latim pulsare. Assim, embora push e puxar possam ser falsos amigos, elas são tecnicamente cognatos verdadeiros, sendo puxar talvez o irmão gêmeo maligno da família.

Old Chinese and related resources

2018-12-30 22:35 -0200. Tags: lang, in-english

This post collects some links to resources about Old Chinese I have found on the web. Maybe I will move these to a page of their own, as soon as I figure out how I want to organize the non-blog parts of this website.


Short videos



Summer School in Old Chinese Phonology, 2007

These are videos of a 3-day workshop with presentations by Baxter and Sagart.

  1. The Baxter-Sagart System of Old Chinese Reconstruction 2007-07-02 (mp4)
  2. Old Chinese Word Structure 2007-07-02 (mp4)
  3. Onsets 2007-07-03 (mp4)
  4. Finals 2007-07-03 (mp4)
  5. Lines of Evidence 2007-07-04 (mp4)
  6. Sino-Tibetan and Beyond 2007-07-04 (mp4)

Recent Advances…

Trivia etymologica #3: -ães, -ãos, -ões

2017-08-17 13:29 -0300. Tags: lang, etymology

Em português, palavras terminadas em -ão têm três possíveis terminações de plural diferentes: -ães (cão → cães), -ãos (mão → mãos) e -ões (leão → leões).

Como é que pode isso?

Esse é mais um caso em que olhar para o espanhol pode nos dar uma idéia melhor do que está acontecendo. Vamos pegar algumas palavras representativas de cada grupo e ver como se comportam os equivalentes em espanhol:

Singular Plural
Português Espanhol Português Espanhol
-ães cão can cães canes
capitão capitán capitães capitanes
alemão alemán alemães alemanes
-ãos mão mano mãos manos
irmão hermano irmãos hermanos
cidadão ciudadano cidadãos ciudadanos
-ões leão león leões leones
nação nación nações naciones
leão león leões leones

O que nós observamos é que em espanhol, cada grupo de palavras tem uma terminação diferente tanto no singular (-án, -ano, -ón) quanto no plural (-anes, -anos, -ones), enquanto em português, todas têm a mesma terminação no singular (-ão), mas terminações distintas no plural (-ães, -ãos, -ões). A relação entre as terminações no plural em espanhol* e português é bem direta: o português perdeu o n entre vogais (como já vimos acontecer no episódio anterior), mas antes de sair de cena o n nasalizou a vogal anterior, i.e, anes → ães, anos → ãos, ones → ões.

Já no singular, as três terminações se fundiram em português. O que provavelmente aconteceu (e eu preciso arranjar mais material sobre a história fonológica do português) é que o mesmo processo de perda do n + nasalização ocorreu com as terminações do singular (i.e., algo como can → cã, mano → mão, leon → leõ), e com o tempo essas terminações se "normalizaram" na terminação mais comum -ão. Como conseqüência, o singular perdeu a distinção entre as três terminações, enquanto o plural segue com três terminações distintas.


* Tecnicamente eu não deveria estar partindo das formas do espanhol para chegar nas do português, mas sim partir da língua mãe de ambas, i.e., o dialeto de latim vulgar falado na Península Ibérica. Porém, nesse caso em particular o espanhol preserva essencialmente as mesmas terminações da língua mãe, então não há problema em derivar diretamente as formas do português a partir das do espanhol.

Trivia etymologica #2: cheio, full

2017-03-13 00:17 -0300. Tags: lang, etymology

Seguindo o tema de fartura do último episódio, começaremos nosso passeio etimológico de hoje com a palavra cheio. Cheio vem do latim plenus. É uma mudança fonética e tanto, então vamos por partes.

O meio

Cheio em espanhol é lleno. Olhar para o espanhol freqüentemente ajuda a entender a etimologia de uma palavra em português, porque o espanhol conserva alguns sons que se perderam em português, e vice-versa. Neste caso, o espanhol conservou o n de plenus que o português perdeu. O português tem uma séria mania de perder os sons l e n entre vogais do latim. Exemplos:

Quando as vogais antes e depois do l ou n deletado são iguais, o português junta as duas numa só:

E entre certos encontros de vogais (aparentemente entre ea e entre eo), o português prefere inserir um i (produzindo eia, eio):

Por outro lado, quando o l ou n era geminado em latim, isto é, ll e nn, ele é mantido como l e n em português. Já em espanhol, o som resultante do ll do latim continua sendo escrito como ll, mas é pronunciado como o lh do português (com variações dependendo do dialeto), e o nn do latim se torna o ñ do espanhol (pronunciado aproximadamente como o nh do português). Exemplos:

O início

A outra diferença entre cheio e lleno é o som inicial. Nesse caso, nem o português nem o espanhol conservaram o som original do latim, mas pl e cl quase sempre viram ch em português e ll em espanhol. Outros exemplos:

Provavelmente havia alguma peculiaridade na pronúncia desses encontros em latim (ou pelo menos em alguns dialetos de latim), porque eles sofrem modificações em diversas outras línguas românicas também; em particular, em italiano as palavras acima são chiave (o ch tem som de k), chiamare, pioggia e piorare. No geral, o que se observa é uma palatalização desses encontros consonantais: a pronúncia deles tendeu a evoluir para um ponto de articulação mais próximo do palato (céu da boca). Meu palpite é que o l nesses encontros tinha um som mais próximo do nosso lh nesses dialetos (i.e., /klʲavis, plʲuvia/ (algo como clhávis, plhúvia)).

Surpreendentemente, o francês, que costuma ser uma festa de mudanças fonéticas, mantém ambos os encontros intactos (clef, clamer, pluie, pleurer).

Mudanças regulares

Ok. Como vimos, plenus do latim se torna cheio em português. O que vimos são duas mudanças fonéticas regulares na história do português: uma mudança de pl inicial para ch, e uma perda de n entre vogais. No geral, as mudanças de pronúncia que ocorrem ao longo da história de uma língua têm essa natureza regular: elas afetam certos sons em todas as palavras da língua, sempre que eles ocorrem em determinadas circunstâncias. Claro que como com toda regra, ocasionalmente há exceções, por diversos motivos, mas no geral se espera essa regularidade quando se está formulando uma regra que explique a relação entre duas línguas aparentadas (no caso, latim e português).

Mas espera um pouco, você me diz: o português também possui a palavra pleno (e plenitude), que apresenta tanto o pl inicial quanto o n intervocálico original de plenus. Como é que pode isso?

A resposta nesse caso é que pleno é uma palavra reimportada do latim, depois que esses sound shifts já tinham acontecido. O português (e demais línguas românicas, bem como o inglês) contêm inúmeras palavras desse tipo, tipicamente reintroduzidas a partir da época do Renascimento, quando a cultura clássica grega e romana entrou em alta novamente. O resultado é que freqüentemente o português tem duas versões de uma mesma palavra latina: uma herdada naturalmente do latim, passando pelas mudanças de pronúncia históricas da língua, e uma reimportada diretamente do latim, sem a passagem por essas mudanças. Tipicamente, essas palavras reintroduzidas têm um tom mais formal, enquanto as versões "nativas" têm um tom mais coloquial. Exemplos são cheio e pleno, (lugar) vago e vácuo, chave e clave, paço e palácio. Outras vezes o português tem uma palavra nativa, herdada do latim e passando pelas mudanças fonéticas esperados, e diversas palavras relacionadas importadas posteriormente do latim sem essas mudanças. Exemplos são vida (do latim vita) e vital; chuva (do latim pluvia) e pluvial; mês (do latim mensis) e mensal.

Ok, plenus

Vamos voltar para o latim. Plenus em latim significa – adivinhem só – cheio. Em latim também há um verbo relacionado, pleo, plere, que significa encher. O particípio desse verbo é pletus, que, combinado com a típica variedade de prefixos, nos dá palavras como repleto, completo (e, em inglês, deplete). De in- + plere obtemos implere, que é a origem de encher. De sub- + pleo obtemos supplere, de onde vem suprir (e supply, e suplemento). De com/con- + pleo obtemos complere, de onde vem cumprir (além de completo, e complemento).

Em última instância, pleo vem da raiz indo-européia *pleh₁. Outras palavras dessa mesma raiz são plus (e duplus, triplus, etc.) e polys em grego (de onde vem o nosso prefixo poli-).

Há muitas mil eras eu falei por aqui sobre a Lei de Grimm, que descreve a evolução de alguns sons do proto-indo-europeu nas línguas germânicas. Como visto lá, o p do proto-indo-europeu corresponde ao f nas línguas germânicas. E sure enough, full e fill vêm da mesma raiz *pelh₁ que nos dá pleno e cheio. Viel do alemão também vem da mesma raiz. (Esse v se pronuncia /f/. Curiosamente, o alemão vozeou o /f/ para /v/ antes de vogais na Idade Média e shiftou ele de volta para /f/ alguns séculos depois.)

E a essa altura, já estamos todos cheios do assunto.

Trivia etymologica #1: much vs. mucho

2017-03-05 01:43 -0300. Tags: lang, etymology

Há muitos mil anos, explicando para alguém a diferença entre muy e mucho em espanhol, eu fiz uma analogia com o inglês: muy é como very em inglês, e modifica adjetivos e advérbios, e.g., muy rápido = very fast. Já mucho é como many em inglês, e modifica substantivos: muchas cosas = many things. Na verdade essa explicação é parcialmente correta: muchos no plural é como many, e é usado para substantivos contáveis (como em muchas cosas). Mas mucho no singular é como much, e é usado para substantivos não-contáveis, e.g., mucho dinero = much money.

Na época eu me perguntei: será que much e mucho são cognatas? Apesar da similaridade de som e significado, seria pouco provável que as duas palavras fossem cognatas (a menos que o inglês tivesse importado a palavra do espanhol, o que também seria pouco provável). Isso porque se houvesse uma raiz indo-européia comum para as duas palavras, ela teria passado por mudanças fonéticas diferentes no caminho até o inglês e até o espanhol, e seria pouco provável que o resultado final se parecesse tanto em ambos os branches.

As it turns out, as palavras realmente não são cognatas. much vem do inglês médio muche, muchel, do inglês antigo myċel, miċel. O ċ (som de "tch", ou /tʃ/ em IPA) do Old English é resultado de um shift de /k/ para /tʃ/ diante de /e/ e /i/. Assim, a palavra original era algo como /mikel/, que, em última instância, vem da raiz indo-européia *méǵh₂-, que significa 'grande'. É a mesma raiz de mega em grego, e de magnus em latim. *méǵh₂- com o sufixo *-is, *-yos resulta em latim nas palavras magis, que é a origem da palavra mais em português, e maior, que é a origem de (quem imaginaria?) maior em português. Resumindo, much, mega, mais e maior são todas cognatas.

Mucho, por outro lado, assim como o muito do português, vem do latim multus, que é também a origem do prefixo multi e de palavras como múltiplo. Segundo nosso amigo Wiktionary, multus vem da raiz indo-européia *mel-, e é cognata de melior (de onde vem melhor), que nada mais é do que *mel- com o mesmo sufixo *-yos que transforma mag(nus) em magis e maior.

Por fim, muy é uma contração do espanhol antigo muito, cuja derivação é trivial e sugerida como exercício para o leitor.

And so it goes

2016-07-15 14:40 -0300. Tags: music, lang

Fazia muitos mil kalpas que eu queria achar a letra em cantonês da música tema do filme Tai Chi Master (太極張三豐). No fim consegui achar vendo um pedaço do filme com legendas em chinês, transcrevendo parte da legenda e procurando nas interwebs. A letra veio daqui, e a transcrição em Jyutping daqui. (As transcrições em vermelho são as que eu corrigi conferindo no Wiktionary as que eu achava que estavam erradas.) Aqui tem uma versão com legendas em inglês do trecho da música que aparece no filme, mas não sei quão confiável é a legenda.






* * *






Ensinando inglês

2015-06-09 23:28 -0300. Tags: lang, comic, img, random


Quadro 1:

B: Como se diz "fazer" em inglês?

A: "Do".

B: Mas "do" não é pra fazer pergunta?


Quadro 2 (cena imaginada por A):

A: Ah, sim, o inglês usa "do" como um auxiliar dummy em perguntas, provavelmente como uma maneira de equilibrar a tendência histórica do inglês de deslocar o verbo para o começo em perguntas, como as demais línguas germânicas, com a tendência a  uma ordem SVO mais rígida, provavelmente motivada pela perda de morfologia que permita distinguir substantivos e verbos em inglês, o que pressiona a língua a desambiguar usando a sintaxe ...


Quadro 3:


A: É, serve pra fazer pergunta também.

Baseado em fatos reais.

(E eu ia mudar o texto para "distinguir substantivos e verbos facilmente em inglês", mas já gastei meu estoque de paciência com o GIMP hoje.)

2015-05-14 20:55 -0300. Tags: lang, img, random, comic

Para fins de conservação para a posteridade, inflijo-vos este quadrinho que eu postei no reddit mais ou menos um ano atrás.

A: So you and Mary are over?
B: Yeah.

A: Why? You made such a good couple.
B: It would never work out. She thinks Proto-Indo-European had an */a/.
A: Oh. What?

B: I told her: "Maybe in the latest stages, but not originally. */a/ is really just underlying */eh₂/". But she shook her head and said: "Not typologically plausible". It was horrible.
B: Yeah, I know!

2015-04-17 22:52 -0300. Tags: random, life, lang

me; hahahah, ganhei meu dia aqui
me: abri uma página que era pra ter um ícone de "loading"
µ: hm
me: mas a modinha agora é usar fontes com ícones ao invés de imagens
me: só que o meu browser tá setado pra forçar a usar as minhas fontes ao invés das da página
µ: hm
me: aí o loading virou um ideograma rotatório
µ: hsauoihasoihauias
me: e tu não vai achar graça nenhuma nisso, mas eu curti horrores :P
me: hmm, pelo visto tu achou graça :P
µ: sim
µ: imaginei um ideograma chines significando "paz mundial que se iniciou na cozinha de um homem simplorio" rodando na tua tela

(Eu ainda não descobri que ideograma é esse, by the way.)

Update: O codepoint oficial do caractere (𤃉) é U+240C9. Consegui chegar nele procurando pelos componentes (氵厂禾禾心) no MDBG e depois no CHISE (que eu não conhecia até então). Mas ainda não descobri o que ele significa (o caractere mais próximo que encontrei com significado foi "trickle, drip; strain; dregs").


[Idegrama rotatório de significado desconhecido]

