Elmord's Magic Valley

Posts com a tag: `lang`

Breakup

2015-05-14 20:55 -0300. Tags: lang, img, random, comic, em-portugues

Para fins de conservação para a posteridade, inflijo-vos este quadrinho que eu postei no reddit mais ou menos um ano atrás.

Quadrinho:
A: So you and Mary are over?
B: Yeah.

A: Why? You made such a good couple.
B: It would never work out. She thinks Proto-Indo-European had an */a/.
A: Oh. What?

B: I told her: "Maybe in the latest stages, but not originally. */a/ is really just underlying */eh₂/". But she shook her head and said: "Not typologically plausible". It was horrible.
A: WTF?
B: Yeah, I know!

1 comentário / comment

Ideogramas

2015-04-17 22:52 -0300. Tags: random, life, lang, em-portugues

me; hahahah, ganhei meu dia aqui
me: abri uma página que era pra ter um ícone de "loading"
µ: hm
me: mas a modinha agora é usar fontes com ícones ao invés de imagens
me: só que o meu browser tá setado pra forçar a usar as minhas fontes ao invés das da página
µ: hm
me: aí o loading virou um ideograma rotatório
µ: hsauoihasoihauias
me: e tu não vai achar graça nenhuma nisso, mas eu curti horrores :P
me: hmm, pelo visto tu achou graça :P
µ: HSAUOHSAIOSAHAOSIHASUOUI
µ: sim
µ: imaginei um ideograma chines significando "paz mundial que se iniciou na cozinha de um homem simplorio" rodando na tua tela

(Eu ainda não descobri que ideograma é esse, by the way.)

Update: O codepoint oficial do caractere (𤃉) é U+240C9. Consegui chegar nele procurando pelos componentes (氵厂禾禾心) no MDBG e depois no CHISE (que eu não conhecia até então). Mas ainda não descobri o que ele significa (o caractere mais próximo que encontrei com significado foi 瀝 "trickle, drip; strain; dregs").

P.S.:

[Idegrama rotatório de significado desconhecido]

8 comentários / comments

Yeah, I code-switch heavily

2014-11-02 02:31 -0200. Tags: lang, life, ramble, em-portugues

Semana passada eu resolvi ir no Verda Kafo (evento esperantista que ocorre no último sábado de todo mês em Porto Alegre), depois de alguns meses de sumiço. Um verdkafano perguntou como ia o meu mestrado, e o Marcus mencionou que o meu blog tinha a resposta. A pedidos, eu passei a URL para ele e mais um dos participantes. Foi só algumas horas depois disso que eu pensei "bá, vão me encher o saco no próximo Verda Kafo por causa das frases em inglês strewn in no meio dos textos", mas aí já era tarde.

Esse fenômeno de alternar entre línguas em um mesmo diálogo ou em uma mesma frase é denominado code-switching.* O artigo da Wikipédia menciona uma porção de explicações sociológicas de por que as pessoas code-switcham. No meu caso, entretanto, for most part, acho que nenhuma das explicações apresentadas se encaixa. Eu simplesmente acho mais fácil dizer algumas coisas em inglês, às vezes porque a sintaxe do termo em inglês é diferente, às vezes sem nenhum motivo aparente. A grande maioria das coisas que eu leio são em inglês, e eu passo boa parte do meu tempo lendo, então acho que não é de admirar. Em tempos de outrora, quando eu estava aprendendo esperanto e o usava com mais freqüência, era bastante comum eu achar mais fácil dizer algumas coisas em esperanto do que em português, primariamente graças ao sistema de composição e derivação supimpa (eu ainda uso "X-ilo" ocasionalmente, onde X é uma palavra em português ou em esperanto, para me referir ao "utensílio de fazer X"), mas às vezes também porque a minha cuca queria dizer alguma coisa com uma estrutura sintática e o português exige outra. Um exemplo "clássico" disso com o inglês são frases como she was named after a tree, que eu nem tenho certeza de como dizer em português ("ela foi nomeada segundo uma árvore" doesn't quite cut it (como se diz "doesn't quite cut it" em português?)).

Poder-se-ia alegar que isso representa a decadência do português e o efeito do imperialismo estadunidense. Eu não sei. Em primeiro lugar, a identidade da língua portuguesa está bem saudável, já que são poucos os falantes de português que fazem code-switching. Em segundo lugar, assim como eu acho mais fácil dizer certas coisas em inglês, há uma porção de outras coisas que eu acho mais fácil dizer em português. Acontece simplesmente que, nas situações em que meus interlocutores falam tanto português quanto inglês, a conversa se dá primariamente em português (evidentemente), então é raro eu ter a oportunidade de falar inglês com frases em português strewn in. (Cabe notar que eu só atravesso termos em inglês quando eu sei que o interlocutor os há de entender, já que, imaginem vocês, comunicação exige entendimento entre as partes. Porém, em alguns casos eu tenho que fazer um esforço extra para dizer certas coisas em português ao invés de falar da maneira que me é mais confortável.)

Por fim, enquanto eu estava ideando este post, eu pensei comigo mesmo: "Seriously, tu tá te justificando pela maneira como tu escreve no teu próprio blog? Que diabos é isso, um blog de gente se explicando?" Não era nem para eu ter que escrever isso (de fato, eu não tenho que escrever isso), mas enfim.

_____

* Segundo o artigo, o uso de múltiplas línguas na escrita é chamado de linguagem macarrônica, mas aparentemente o termo é mais usado para descrever certas formas literárias em que a mistura tem algum propósito especial, freqüentemente humorístico. No caso aqui do blog, entretanto, geralmente o meu uso de inglês atravessado no meio do texto simplesmente reflete a maneira como eu falo quando sei que o interlocutor entende ambas as línguas. No geral, eu tendo a fazer isso mais nos posts mais "pessoais" e menos nos posts mais informativos. Acho.

7 comentários / comments

Orthographica II: ortografia etimológica, o latim e o proto-indo-europeu

2014-08-23 00:05 -0300. Tags: lang, rant, em-portugues

No último post eu falei um pouco sobre a questão da reforma ortográfica do português e argumentei contra a idéia de que a reforma seria um "emburrecimento da língua". Talvez você queira lê-lo antes de continuar. Neste post, apresento mais alguns pensamentos que tive sobre o assunto.

A idéia de simplificar a ortografia suscita uma tremenda oposição, como os comentários na notícia linkada no último post servem para exemplificar. Num nível mais superficial, há a oposição à mudança puramente por ser uma mudança. Não há muito o que dizer aqui além do que eu já disse no último post; orthographia não se escreve mais assim desde 1943 e ninguém está sentindo falta desses hs. Da mesma forma, acredito que ninguém ache ruim escrever bife e futebol ao inves de beef e football, e no entanto assim foi há nem tantas décadas assim.

Um argumento mais elaborado é de que a grafia das palavras deve ser mantida como está para refletir a etimologia das palavras. Por exemplo, exibir se escreve com x porque provém da palavra latina exhibere, que se escreve com x (em latim, esse x tem de fato som de ks). Manter essa ortografia é bom porque evidencia o prefixo ex-, que é comum a tantas outras palavras e tem um significado mais ou menos bem-definido. Similarmente, escrever biologia ao invés de biolojia é bom porque evidencia a relação dessa palavra com a palavra biólogo. Se escrevêssemos tudo como falamos, essas relações entre as palavras, que são visíveis em suas formas gregas e latinas originais, seriam obscurecidas.

Acontece, entretanto, que quando os romanos começaram a escrever o latim, eles o escreveram exatamente como o falavam: em latim clássico, c sempre tem som de [k] (Cicero se lê "quíquero"), g tem sempre som de [g] (magis se lê "máguis"), x sempre tem som de [ks], as consoantes duplas (como em anno) realmente eram pronunciadas mais longas, e assim por diante. Em geral, quando uma língua recém adota um sistema de escrita [alfabético], ele tende a refletir bastante fielmente a fala; é só com o tempo que, à medida em que a língua vai mudando, a escrita resiste a acompanhar essas mudanças, e perde-se a relação direta entre a grafia e a pronúncia.

Ok, mas em latim não tem problema escrever como se fala, porque latim é latim e, sendo uma língua mais "pura" e menos "corroída" pela ação do tempo, essas relações que para nós só são visíveis na ortografia eram parte da língua latina viva, e portanto sua escrita baseada na fala as conserva, right?

Well, não é bem assim. O latim não brotou do nada. Assim como o português, o espanhol, o italiano, o francês, etc. derivam de uma língua anterior (o latim), e assim formam a família das línguas latinas ou românicas, também o latim, o grego, o sânscrito, o germânico, o eslávico, etc. derivam de uma língua comum, e formam assim a família das línguas indo-européias. O problema é que essa língua é tão antiga que nunca chegou a ser escrita; porém, é possível observar as similaridades e diferenças das línguas descendentes que ela deixou e reconstruir com alguma segurança como era essa língua original. A essa língua reconstruída denomina-se proto-indo-europeu.

E assim como o português é uma versão "corroída" de latim, o latim é uma versão "corroída" de proto-indo-europeu, e algumas relações entre palavras que eram visíveis em proto-indo-europeu ou em proto-latim não o são em latim. Voltando ao nosso exemplo clássico, exibir (pronunciado "ezibir") em latim é exhibere (pronunciado "eks-híbere", sem nenhuma letra muda nem irregularidade), mostrando claramente na pronúncia e na escrita o prefixo ex-. Mas e o que fazer do -hibere? Pois acontece que hibere nada mais é do que uma versão "corrompida" do verbo habere, que dá origem ao nosso haver. Essa mudança habere → hibere não é de uma natureza muito diferente da pronúncia de comi como "cumi" ou escola como "iscola" em português brasileiro moderno. E no entanto, essa "corrupção" que ocorreu entre o proto-latim e o latim foi tomada como forma oficial em latim; em latim clássico, se escreve como se fala.

Outro exemplo: as sequências de sons /ts/ e /ds/ do proto-indo-europeu se perderam em latim. Assim, "potentes" (no plural) em latim é potentes, mas no singular é potens, pois o t da forma original (*potents) se perdeu. Da mesma forma, a conjugação do verbo "ser" (esse) em latim é sum, es, est (de onde vem o nosso sou, és, é), mas a conjugação do verbo "poder", que em latim é derivado da expressão potis esse ("ser capaz") é possum, potes, potest, pois o t do *potsum original se perdeu, e essa perda é refletida na escrita.

E quanto ao próprio verbo "ser"? Sum, es, est, sumus, estis, sunt não é exatamente um primor de regularidade. Ok, o verbo "ser" é irregular em tudo que é língua, especialmente nas línguas indo-européias... interessante essa última observação, não? Acontece que a forma reconstruída desse verbo em proto-indo-europeu é h₁ésmi, h₁ési, h₁ésti, h₁sm̥ós, h₁sté, h₁sénti, que tem uma cara bem mais regular; até dá para distinguir um radical: h₁es-. (Em proto-indo-europeu, é comum os radicais terem a forma consoante-vogal-consoante, onde a vogal alterna entre e, o e ausência de vogal ao longo da conjugação ou declinação.) Agora o que é esse h₁? Trata-se de uma das chamadas consoantes laringeais do PIE. As laringeais não são nada mais, nada menos do que sons similares a h, que se perderam em todas as línguas descendentes exceto na família do hitita, deixando apenas vestígios de sua anterior existência (normalmente na forma de vogais ou efeitos sobre vogais adjacentes) na maioria das línguas indo-européias. That's right, os hs do PIE já tinham ficado mudos 3 mil anos atrás e os romanos nem chegaram a tomar conhecimento de sua existência, e portanto eles não são refletidos na escrita do latim. (Os hs do latim provêm de outros fonemas do PIE, tais como /gʰ/, que se "corromperam" e transformaram-se em h com o tempo.) Se os falantes de proto-indo-europeu estivessem vivos e dotados de escrita nessa época, eles teriam tido a mesma reação diante da escrita do latim que nós temos diante de propostas de reforma ortográfica em português.

I disapprove of your orthographic developments!

O ponto onde eu quero chegar é: defende-se a manutenção da ortografia atual para conservar as relações etimológicas com o latim, língua-origem do português, mas o próprio latim não preserva em sua ortografia diversas relações etimológicas com a sua língua-origem. Se os falantes de latim clássico podiam escrever como falavam, por que nós não podemos?

Disclaimer

Não, embora possa parecer, eu não estou promulgando a reforma; no momento não expresso nem apoio nem oposição. Meu intento foi unicamente demonstrar uma fraqueza do argumento pró grafia etimológica. Certamente há outros argumentos possíveis em favor da grafia etimológica (por exemplo, que manter uma proximidade com a ortografia do latim facilita nossa vida para aprender outras línguas latinas e o inglês), bem como contra (escrevemos amigo e amizade (do latim amicus e amicitate-) e nem por isso deixamos de perceber a relação entre essas palavras). Decida por si mesmo. Ou não.

7 comentários / comments

Orthographica

2014-08-20 01:31 -0300. Tags: lang, rant, ramble, em-portugues

A notícia de que estão querendo propor outra reforma ortográfica me trouxe à mente umas cousas de que eu gostaria de falar.

Da inconsistência da ortografia vigente

Certa feita, estávamos eu e familiares percorrendo as verdejantes terras de Viamãoheimr, quando um dos indivíduos exclamou algo do tipo: "Olha lá, a placa escrito 'ezibida' com 'z'. E aposto que a pessoa não escreveu assim pra ser diferente, não sabia mesmo." O primeiro pensamento que me veio à mente foi:

Será que, ao invés de zoar da ignorância do povo, nós não devêssemos ficar é preocupados com o estado da educação neste país?

Mas logo depois me ocorreu outro:

Não é fantástico que hoje em dia praticamente todo o mundo saiba ler e escrever, ainda que imperfeitamente, coisa que não era verdade dois séculos atrás nem durante a maior parte da história da escrita?

E, finalmente:

"Exibida" ainda se escreve com "x", really?

É quanto a este último que eu pretendo falar.

A nossa ortografia mantém um bocado de irregularidades (no sentido de que nem toda letra ou seqüência de letras corresponde a um único som e vice-versa), em nome de conservar a etimologia das palavras. Por exemplo, exibir se escreve com x para manter a ortografia similar à palavra latina exhibere que lhe dá origem. Seria um argumento válido para a manutenção da ortografia vigente, se não fosse pelo fato de que esse princípio é seguido de maneira bastante inconsistente.

Por exemplo, diversas palavras que contêm os prefixos/preposições latinos ex- e extra- são escritas com x em português, tais como extrair, extraditar, etc. Mas estranho (do latim extraneus) se escreve com s, sem nenhum bom motivo (que me conste). Em um caso extremo, extensão se escreve com x, mas estender se escreve com s.

O h etimológico é mantido em início de palavra, mas não em outras posições: habitar se escreve com h, mas desabitar não. Que princípio justifica a manutenção em um caso e não no outro?

C tem som de [k] ou de [s] dependendo do contexto, o que ajuda a manter a ortografia de palavras como pouco e paucidade consistente, mesmo já fazendo uns mil e tantos anos que esses dois cs não têm mais o mesmo som. Por outro lado, o passado de fico é fiquei, uma mudança de c para qu que não ocorre por nenhum motivo etimológico, mas tão somente para contornar a irregularidade da pronúncia da letra c em português.

"Estão emburrecendo o português"

Na notícia que me linkaram sobre o assunto, pode-se encontrar um bocado de comentários dizendo que a proposta "emburrece o português", "é a legalização da burrice", "emburrecer a gramática", "E são regras, pelo amor de Deus! Isso não pode ser aprovado, são várias gerações que aprenderam a escrever seguindo uma regra", etc., etc. Eu não perdi muito tempo na referida seção de comentários porque a minha tolerância a essas coisas hoje em dia é muito pequena, mas deu para dar uma idéia. (Também havia uma boa dose de comentários pró-reforma no texto. Curiosamente, dei uma olhada na versão de papel da Zero Hora de ~~hoje~~ ontem, na seção de mensagens dos leitores, e haviam publicado uns quatro comentários recebidos via Facebook sobre o assunto, nenhum pró-reforma. Chamamos isso de imparcialidade.)

Esses comentários me corroem o fígado por duas razões. Em primeiro lugar: reformar a ortografia "emburrece a língua" (tanto quanto isso faz sentido)? Então o que fazer das reformas que eliminaram o ph, o h de exhibido, o y de pyrâmide, o ch de chaos, a consoante dupla de innovar? Elas "emburreceram a língua"? Não são tantas gerações assim que aprenderam a escrever em qualquer dada ortografia no Brasil; a última reforma foi aprovada em 2009, a anterior em 1971 e a anterior a essa em 1943.

Em segundo lugar: a ortografia não é a língua; estritamente, a ortografia não é sequer parte da gramática. Mesmo que o português deixasse de ser escrito, ou que fosse escrito em alfabeto cirílico, continuaria sendo a mesma língua, com as mesmas regras gramaticais. Evidentemente, as línguas costumam ter um sistema de escrita oficial associado a si, mas a língua é independente do sistema de escrita usado para escrevê-la (há inclusive línguas que possuem múltiplos sistemas de escrita oficiais).

Então tu defende a reforma?

Não. Muito embora eu discorde da noção de que a reforma "emburrece a língua", nem por isso eu aprovo a tal reforma. Na verdade eu sequer aprovo ou (tanto quanto me é possível) adoto a última reforma aprovada (como alguns leitores hão de ter notado pelo meu uso da grafia "idéia"). Na verdade eu tenho cá para mim sérias ressalvas quanto à existência de um órgão regulador da língua e da regulação da norma ortográfica por lei; o inglês vive sem um órgão regulador e ninguém sofreu danos deletérios por conta disso. (Ok, talvez a ortografia do inglês possa ser considerada um dano deletério.) Especialmente quando reformas são promulgadas sem qualquer consulta à população (isso é um problema geral da democracia representativa, but I digress).

Voltando especificamente à última reforma proposta: este pessoal do R7 resolveu falar com El Hombre Marcos Bagno, que levanta alguns pontos interessantes com os quais qualquer reforma que pretenda aproximar a escrita da fala tem que lidar. Por exemplo, em mestre o s tem som de "s", mas em mesmo tem som de "z"; deveremos escrever mezmo? Em alguns lugares, o s de mestre tem som de "s", em outros tem som de "x"; deveremos aceitar tanto mestre quanto mextre como grafias válidas?

De qualquer forma, a proposta tal como está sendo apresentada parece não ter sido muito bem pensada. Em particular, pelo menos na reforma tal como os jornais a estão apresentando, tanto c quanto q seriam mantidos com som de [k], e o som inicial de "rato" continuaria sendo escrito com "r" no início de palavra e "rr" no meio. Se é para fazer uma reforma radical como a que se está propondo, então que pelo menos adotem uma ortografia realmente lógica, e que as exceções, se houverem, sejam justificadas por algum guiding principle.

Alguns dos proponentes da reforma dizem que "A simplificação ortográfica é a porta para a eliminação do analfabetismo". Será? O Japão usa um sistema de escrita absurdamente complicado, que consiste de dois silabários e um conjunto de mais ou menos dois mil ideogramas, cuja leitura pode ser drasticamente diferente dependendo do contexto (今 se lê "ima" e 日 se lê "hi", mas 今日 se lê "kyō"), e no entanto o Japão tem uma taxa de alfabetização de ~~mais de oito mil~~ 99% (fonte). Claro que, pode-se argumentar, quanto mais complexo o sistema de escrita, mais tempo se perde apredendo-o que poderia ser usado de maneira mais útil para outras coisas, e mais inacessível ele se torna a quem não tem esse tempo para dedicar a aprendê-lo (e.g., quem não termina o ensino fundamental). Por outro lado, não me é claro se haveria um ganho significativo em termos de alfabetização passando da ortografia atual do português (que já é bastante próxima da fala) para uma ortografia mais regular.

Então tu defende o quê?

Eu não defendo nada. Isso aqui é para terminar que nem um daqueles episódios do South Park que começam com uma questão polêmica e no final se fica com a impressão de que ambos os lados da discussão estão errados.

(Ok, eu pessoalmente defendo o status quo. Aliás, o status quo ante, de volta à ortografia anterior à última reforma. Mas neste post aqui eu não tento defender nada.)

Caveat commentator

Eu tenho uma experiência prévia ruim com posts que escapam para o mundo selvagem e atraem comentários menos-que-positivos. Na verdade a negatividade da experiência em questão foi amplificada pelo fato de eu ter sido pego absolutamente de surpresa na ocasião; hoje em dia eu já posto psicologicamente preparado para estar errado na Internet. De qualquer forma, dado o teor dos comentários na notícia da Zero Hora linkada, parece-me boa precaução deixar um recado a quem pretender comentar o post: caso pretenda deixar sua opinião sobre a reforma, faça-o apenas se for apresentar argumentos para defender sua posição. Comentários do tipo "eu aprovo", "eu desaprovo", "oh, o emburrecimento da língua", "meu, tu mal consegue escrever um parágrafo em português sem tacar um termo em inglês no meio ou conjugar a segunda pessoa errado, quem é tu pra falar de português?", etc., serão sumariamente eliminados, e os autores serão sumariamente insultados (vou mostrar a língua para eles).

Update: Assista ao próximo capítulo de Orthographica: uma batalha entre fonemas e grafemas.

11 comentários / comments

Prevérbios

2013-09-18 00:16 -0300. Tags: lang, em-portugues

Muitas pessoas ficam perplectas ao se depararem pela primeira vez com os assim chamados phrasal verbs do inglês, construções verbo+partícula tais como give up, give in, give away, throw up, take off, take over, blow up, em que o significado da expressão nem sempre é óbvio a partir do significado das partes. Acontece que o português está recheado de um primo distante dos phrasal verbs herdado do latim. Tão recheado que só até agora neste post eu já usei pelo menos seis dessas construções (possivelmente sete, dependendo (oito!) de o que conta como "phrasal verb").

Os phrasal verbs são uma feature comum entre as línguas germânicas. Em alemão e holandês, eles existem na forma de verbos separáveis, i.e., construções partícula+verbo em que a partícula ocorre incorporada ao verbo ou não dependendo da construção verbal. Entre as línguas nórdicas, construções análogas à do inglês também parecem ser bastante comuns (por exemplo, "give up" em sueco é "ge upp" [update: e em islandês a expressão "gefa upp" também existe, mas aparentemente significa "revelar, deixar escapar"]).

Essa característica das línguas germânicas tem origem em um fenômeno análogo em proto-indo-europeu. Em PIE, algumas partículas adverbiais ou posposicionais (não há uma distinção muito forte entre esses dois tipos de partícula em PIE, da mesma maneira que o status de algumas partículas como advérbio ou preposição é duvidoso/variável em inglês ^{[citation needed]}), convencionalmente chamadas prevérbios, possuem efeitos similares sobre o significado de diversos verbos, e podem ser incorporadas ou não ao verbo, de maneira similar ao que ocorre em alemão e holandês. Em latim arcaico, essa situação se preserva. O exemplo clássico é a expressão "sub vos placo" (= "vos supplico"), graças a um camaradinha que escreveu:

Sub vos placo, in precibus fere cum dicitur, significat id, quod supplico
‘when people say, mostly in prayers, sub vos placo, it means the same as supplico’
ob vos sacro, in quibusdam precationibus est, pro vos obsecro, ut sub vos placo, pro supplico
‘ob vos sacro in certain prayers stands for vos obsecro, just as sub vos placo stands for supplico’

Posteriormente, essas partículas passaram a ser obrigatoriamente incorporadas ao verbo em latim. (Em latim, a incorporação de prefixos ocasionalmente provoca certas alterações nas vogais da palavra, daí a mudança de sub placo → supplico e ob sacro → obsecro. No período clássico, as construções originais, com a partícula separada, ja não deviam mais fazer muito sentido para os falantes de latim, razão pela qual o camarada Festus deve ter sentido a necessidade de dar essa explicação.)

Esse fenômeno é absurdamente produtivo em latim. Por exemplo:

Do verbo sistō, sistere (pôr de pé, colocar, colocar-se), obtemos consistir, desistir, persistir, resistir, insistir, subsistir, existir, assistir.
Do verbo struō, struere (compor, construir, preparar), obtemos construir, destruir, instruir, obstruir.

Para encerrar, aqui vai uma lista de algumas palavras originárias de construções partícula+verbo usadas neste post:

perplexo: perplexus (emaranhado, intrincado, confuso) = per + plexus (trançado, torcido). [Curiosamente, plexus é o particípio de plectere, com "ct", de tal forma que "perplecto" até que não é tão sem fundamento...]
deparar: dē + parāre (preparar?).
construção < construir: construere = com- + struere (compor, construir).
expressão < exprimir: exprimere = ex + premere (pressionar); cognata de espremer.
óbvio: obvius = ob + via, i.e., "no meio do caminho", "evidente". [Tecnicamente "via" não é um verbo, mas ok.]
acontecer: ad + contingere (= com- + tangere (tocar, atingir)).
distante: do particípio de distāre (distar) = dis- + stāre (ficar de pé, estar). [Por sinal, "estável" é aquilo que pára de pé, embora isso não tenha muito a ver com o assunto.]
depender: dependēre = dē + pendēre (pender, estar pendurado).

E isso só no primeiro parágrafo (9 palavras em 81 (descartando as palavras em inglês, e contando repetições), i.e., 1/9 das palavras do parágrafo são derivadas construções partícula+verbo). Há um bocado de outras palavras do mesmo tipo, tais como "ad-vérbio", "convencional" (de "con-vir"), "in-corporar", "pre-servar", "pro-vocar", e diversas outras. E isso só contando (< "com-putando") palavras do latim ("aná-logo" é uma construção análoga em grego). De repente o inglês começa a parecer brincadeirinha de criança.

8 comentários / comments

Learn Not Not to Speak Esperanto

2013-07-06 23:18 -0300. Tags: lang, conlang, esperanto, em-portugues

Caros seres,

Por falta de coisa melhor para fazer com a minha vida, resolvi fazer algo que eu queria fazer há uns sete anos e escrever uma crítica a uma famosa crítica ao esperanto chamada Learn Not to Speak Esperanto.

Ainda não revisei o texto direito, e o HTML ainda está meio capenga. Quaisquer erros (fora o HTML) e sugestões podem ser reportados nos comentários deste post. Por precaução, gostaria que me dessem uma semana para revisar o texto antes de divulgarem links por aí. Feedback é bem-vindo.

6 comentários / comments

Desenvolvimentos semânticos paralelos

2013-06-24 18:37 -0300. Tags: lang, em-portugues

Um fenômeno que me chama atenção há tempo é o fato de que certas palavras sofrem mudanças de significado similares em línguas diferentes, mesmo quando as palavras correspondentes nas línguas em questão não são cognatas. No momento só me ocorrem dois exemplos, mas acredito que já vi outros:

Em português, a palavra negócio adquiriu um significado secundário de "coisa". Em inglês, a palavra thing originalmente significava assembléia, e posteriormente adquiriu o significado de "coisa", que se tornou primário. Diz o Wiktionary: “The word originally meant "assembly", then came to mean a specific issue discussed at such an assembly, and ultimately came to mean most broadly "an object". Compare the Latin rēs, also meaning legal matter.”.
Em português, as palavras conta e conto são cognatas (e o verbo contar serve tanto para contar números quanto para contar histórias); a origem dessas palavras é o verbo latino computāre. Em inglês, tale tem um significado secundário de "conta" (que é aparentemente o significado original da palavra), e tale, talk e teller são cognatas. Diz o Etymonline: “The ground sense of the Modern English word in its main meaning, then, might have been "an account of things in their due order."”.

Gostaria de ter mais o que escrever sobre o assunto, mas no momento não me ocorre nada. Este blog provavelmente vai ficar de repouso pelas próximas semanas.

3 comentários / comments

Quenya

2013-03-26 21:11 -0300. Tags: lang, conlang, book, ramble, about, em-portugues

Nos últimos tempos eu andei não postando tanto quanto eu gostaria (o que evidentemente me torna um impostor). Isso se deve em parte porque eu queria escrever posts decentemente coesos e coerentes. Por um lado eu estava meio indeciso sobre se fazia sentido falar de certas coisas em um único post ou se deveria abordá-las separadamente, entre outras questões organizacionais. Por outro lado, eu não andava com nenhum ânimo de escrever posts coerentes.

Well, no more µµµ. Para os próximos posts, e sabe-se lá mais quantos, eu abnego qualquer pretensão a coerência. Para me sentir um pouco melhor (não que isso seja de qualquer benefício ao leitor), vou começar a taggear esse tipo de post (que não é nenhuma novidade por aqui, mas eu tento me iludir de que eles são menos comuns) com a tag ramble. Por sinal, dada a inconsistência no uso de tags nesse blog ao longo do tempo, tem uma dúzia de posts que eu vou ter que taggear retroativamente. But I digress.

Anyway.

Durante as férias, eu resolvi finalmente pegar o Senhor dos Anéis para ler. O motivo por trás disso era primariamente poder desprezar a obra do Tolkien com conhecimento de causa. You see, por motivos mui pessoais e largamente ilógicos eu me via obrigado a ter um mínimo de respeito pela obra literária do Tolkien enquanto não a lesse. Por outro lado, eu tinha cá com os meus botões que o Senhor dos Anéis não valia grande coisa; tanto quanto eu sabia da história, a parte não-maçante era a parte que tinha sido copiada da mitologia nórdica.

Anyway, eu peguei o troço para ler. O livro (e não me diga que são três livros; isso foi idéia da editora) começa com um prólogo explicando o background da história para quem não leu o Hobbit, do qual o LotR originalmente era continuação. O prólogo descreve mui detalhadamente a vida dos Hobbits, tão detalhadamente que eu resolvi dar um fast forward para o fim do capítulo, tão-somente para descobrir que aquele era apenas o primeiro capítulo do prólogo, o qual consiste de nada menos do que quatro capítulos (ou seções, como preferir; eles não são tão longos) numerados e um não-numerado. Diante desta chocante observação, eu larguei o livro de mão e fui ler o Don Quixote (coisa que há de levar um bocado de tempo ainda, já que estou lendo em espanhol, língua na qual eu não estou acostumado a ler naturalmente, e a isso se soma o detalhe de que o vocabulário usado é um tanto quanto arcaico, fora que eu não estou lendo com particular constância; but I digress).

Isso foi há um mês e um tanto. Ontem eu resolvi pegar o LotR de novo (por razões que serão esclarecidas até o fim do post), mas dessa vez eu tomei a sábia decisão de pular inteiramente o prólogo. Eu ia começar a ler a história propriamente dita, e se a coisa continuasse igualmente enfadonha, eu ia largar esse livro de mão de vez, e me contentar em zombar da obra literária do Tolkien sem conhecimento de causa mesmo. Caso contrário, eu seguiria lendo e poderia mui informadamente escrever um post aqui dizendo o quanto eu desgostei da história, e sumiria com esse peso da minha consciência.

Em um golpe fatal contra meu rico e respeitável plano, os dois capítulos que eu li até agora foram surpreendentemente agradáveis.

E é isso. Esse livro provavelmente é digno da fama que tem, e se no fim das contas a história for ruim, pelo menos haverei de conceder que o camarada Tolkien escreve muito bem. Dois capítulos é muito pouco para afirmar qualquer coisa, mas enfim. Em qualquer caso, ler esse livro vai servir para ler The Last Ringbearer depois, uma obra que me parece altamente respeitável.

Mas não é sobre nada disso que eu vim falar originalmente, como o título do post pode sugerir. O que eu vim falar é sobre a obra do Tolkien como conlanger, e esta sim eu sempre admirei. (Famosamente (ou nem tanto), uma vez o Tolkien disse que "The ‘stories’ were made rather to provide a world for the languages than the reverse".) Ontem eu caí por acaso nesta página (procurando por "no word for if" no Google (pois estava eu experimentando com a gramática da minha conlang antes de ir dormir, e estava eu meditando sobre como criar orações condicionais sem uma palavra para "se", e resolvi pesquisar no Google se havia alguma língua que fizesse as coisas mais ou menos como eu tinha em mente, e que outras possibilidades havia para se construir condicionais sem "se" (sim, eu tenho uma conlang, que esteve semi-abandonada pelos últimos cinco anos (but I digress)))), e me chamou a atenção como as frases em Quenya (lê-se "qüênia", não "kênia") soam "naturalmente bonitas". Esse não é meu primeiro contato com Quenya, mas até então, for most part, eu só tinha visto frases criadas pelo próprio Tolkien, em um contexto artístico, e aí é de se esperar que as frases tenham sido cuidadosamente construídas para soarem bem. Mas aí está uma dúzia de frases compostas por uma pessoa não necessariamente preocupada com a beleza poética da tradução de "estou dormindo, deixe sua mensagem ou ligue para XXX" em Quenya, e as frases soam surpreendentemente bem (pelo menos para mim). (Eu ia gravar um ogg com a pronúncia de algumas das frases, mas me parece que os leitores não hão de estar particularmente interessados em ouvir minha bela voz proferindo sentenças aleatórias, e ao invés disso deixo-vos com El Hombre Tolkien Himself recitando uma versão pré-LotR do poema Namárië.)

E foi depois de cair nessa página que eu resolvi tentar retomar a leitura do LotR, e assim, li os acima referidos dois capítulos antes de ir dormir, o que conclui esta mui coesa história contada in media res.

12 comentários / comments

Alfabeto Frenético Interglacial

2013-03-20 14:38 -0300. Tags: lang, em-portugues

Freqüentemente eu vejo gente preferindo manter uma distância saudável do Alfabeto Fonético Internacional (IPA, International Phonetic Alphabet), por parecer "estranho" ou "difícil". Em verdade, o IPA é bastante prático, e neste post pretendo explicar o básico sobre ele.

Comecemos pelo começo

O objetivo do IPA é ser capaz de transcrever os sons de todas as línguas humanas. Para isso, o IPA contém uma centena de letras, e uma dúzia de diacríticos (acentos e outras marcas) que são usados quando necessário para detalhar a pronúncia de um som. Na prática, foneticistas à parte, nenhum mortal precisa aprender todos os símbolos do IPA. Em geral, nós aprendemos os símbolos necessários para transcrever os sons das línguas em que estamos interessados, e se por acaso nos deparamos com um símbolo que não conhecemos, consultamos o famoso diagrama do IPA (ou a Wikipédia, que tem basicamente um artigo para cada letra do IPA, freqüentemente com áudio; o artigo sobre o IPA contém uma versão com links do diagrama). O diagrama do IPA é uma espécie de tabela periódica de sons: a posição de uma letra indica como ela é pronunciada. Veremos isso melhor mais adiante.

Fones e fonemas

Até agora falamos de representar os "sons" da fala, mas "som" é um conceito um tanto quanto vago. Na verdade, o IPA transcreve fones e fonemas. Vamos por partes.

Um fone é a menor "unidade de fala" que pode ser pronunciada independentemente. Por exemplo, em uma palavra como pá há dois fones, representados na escrita pelos caracteres p e á. (Note que os fones não têm relação direta com as letras do alfabeto; em uma palavra como chá também há dois fones, escritos ch e á.)

Um fonema, por sua vez, é um símbolo abstrato que representa a menor unidade de fala capaz de distinguir significado. Vamos com calma.

Uma das grandes sacadas da lingüística moderna é que línguas funcionam à base de contraste: os símbolos lingüísticos (e isso vale tanto para sons quanto para conceitos, formas gramaticais, etc.) são definidos tanto pelo que eles são, quanto pelos outros símbolos lingüísticos que eles não são e dos quais se distinguem. Um exemplo grosseiro: a palavra banco descreve (entre outras coisas) um móvel usado para se sentar. Mas nem todo móvel de se sentar é um banco; em particular, uma das coisas que não é um banco é uma cadeira, i.e., parte do que define um banco é o fato de ele não ser uma cadeira. Se não houvesse uma palavra separada para "cadeira", é provável que a palavra banco pudesse ser usada tanto para bancos quanto para cadeiras. Outras línguas podem fazer divisões diferentes no espaço conceitual. (Por exemplo, o que nós chamamos de banco em português corresponde a bench e stool em inglês. Ou o que se chama de nezumi em japonês corresponde a rato e camundongo em português. Ou o que chamamos de ser e estar corresponde a be em inglês. Ou...)

Da mesma forma, um fonema é definido em parte pelo contraste que faz com os outros fonemas da língua. Por exemplo, existem pelo menos quatro maneiras de se pronunciar o som inicial da palavra rato: como o h do inglês, como um som similar ao j do espanhol, como uma vibrante uvular, ou como uma vibrante alveolar (com sotaque do interior gaúcho). (Ouça-os.) Cada um desses sons corresponde a um fone. Porém, como em português esses sons não são capazes de distinguir significado (não há nenhuma palavra em português em que a escolha de um desses erres faça diferença), todos esses fones correspondem a um único fonema da língua. Em outras palavras, o fone é a realização física, enquanto o fonema é a idéia abstrata. (Note que o que constitui cada fonema depende da língua, enquanto os fones são um fenômeno puramente físico independente de uma língua específica.)

Tudo isso foi para dizer que quando se usa o IPA, normalmente se escrevem transcrições fonéticas (de fones) entre colchetes, e transcrições fonêmicas (de fonemas) entre barras. Como a idéia do IPA é ter, em linhas gerais, uma letra para cada fone (afinal ele é o alfabeto fonético internacional), o que normalmente se faz quando se quer transcrever fonemas é escolher o símbolo de um dos fones para representar o fonema, independentemente da sua realização física. (Freqüentemente se escolhe o símbolo mais conveniente de digitar, ou o fone mais comum.) Assim, poderíamos transcrever as quatro pronúncias de "rato" foneticamente como ['hatu], ['χatu], ['ʀatu], ['ratu], todas elas correspondentes a uma transcrição fonêmica /'ratu/. (Poderíamos ter escolhido qualquer um dos outros símbolos no lugar do r. O símbolo ' indica que a próxima sílaba é tônica.)

Uma transcrição fonética pode ser mais ou menos precisa, dependendo da necessidade do autor. Por exemplo, em uma palavra como vinho, é comum que o i seja nasalizado em contato com o nh (experimente tapar o nariz e pronunciar vinho). Uma transcrição fonética mais precisa ("narrow transcription") da palavra, portanto, seria ['vĩɲu]. Porém, muitas vezes não estamos interessados em uma descrição tão detalhada, e nesse caso podemos usar uma transcrição menos precisa ("broad transcription"): ['viɲu]. De maneira similar, o "r enrolado" do inglês americano, [ɹ], é freqüentemente transcrito por [r] quando essa distinção não é relevante. (Embora os termos "broad transcription" e "narrow transcription" possam passar uma idéia de "oito-ou-oitenta", na verdade há um continuum de transcrições mais ou menos precisas.)

Por fim, ocasionalmente utilizam-se os símbolos < e > para demarcar transcrições na ortografia da língua (ou seja, para indicar que algo não está em IPA): <rato>.

Consoantes e vogais

Os fones se dividem em vogais e consoantes (embora existam border cases para causar a necessária controvérsia em todo e qualquer tópico de lingüística). Basicamente, vogais são os fones que são pronunciados sem impedimento da corrente de ar (e.g., [a]), enquanto consoantes são aqueles em que o ar sofre algum impedimento (e.g., [p], em que os lábios temporariamente impedem a passagem do ar). As descrições da maneira de se pronunciar vogais e consoantes são diferentes; assim, abordaremo-las separadamente.

Consoantes

As consoantes no diagrama do IPA estão dispostas em uma tabela. A coluna em que a consoante se encontra indica o seu ponto de articulação (place of articulation), i.e., onde na boca ocorre o impedimento do ar, enquanto a linha indica o modo de articulação (manner of articulation), i.e., de que maneira exatamente o ar é impedido. Por exemplo, a consonante [p] está na coluna das bilabiais (o impedimento do ar se dá através dos lábios) e na linha das plosivas (a passagem do ar é totalmente interrompida e depois liberada em uma "explosão").

Em alguns pontos da tabela há um par de letras no mesmo quadrado (por exemplo, p b). Nesses casos, a letra da direita representa uma consoante sonora ou vozeada (voiced), i.e., há vibração das cordas vocais durante a pronúncia da consoante, enquanto a da esquerda representa uma consoante surda ou desvozeada (voiceless), i.e., não há vibração. Para entender a diferença, experimente pronunciar alternadamente sssss, zzzzz ou fffff, vvvvv. (Nos pontos em que só há uma consoante, normalmente ela é sonora; caso seja necessário transcrever a consoante surda equivalente, utiliza-se um diacrítico. Por exemplo, um [m] surdo se transcreve [m̥].)

Segue uma tabela das consoantes do português do Brasil, com descrições dos pontos e modos de articulação.

		Bilabial ambos os lábios	Lábio-dental lábio inferior e dentes superiores	Alveolar língua e alvéolo (a "protuberância" atrás da gengiva superior)	Pós-alveolar ponta da língua toca a região logo atrás do alvéolo, antes do céu da boca	Palatal meio da língua e céu da boca	Velar parte de trás da língua e palato mole	Uvular parte bem de trás da língua e úvula ("campainha")	Glotal glote (passagem entre as cordas vocais)
Plosiva interrupção total do ar seguida de "explosão"	Sonora	`[b]` bato		`[d]` dado			`[g]` gado
Plosiva interrupção total do ar seguida de "explosão"	Surda	`[p]` pato		`[t]` tato			`[k]` cato
Nasal interrupção total do ar pela boca; passagem do ar pelo nariz livre	Sonora	`[m]` mato		`[n]` nato		`[ɲ]` nhoque
Fricativa interrupção parcial do ar, produzindo "turbulência"	Sonora		`[v]` vaca	`[z]` zelo	`[ʒ]` jato				`[h]` rato¹
	Surda		`[f]` faca	`[s]` selo	`[ʃ]` chato			`[χ]` rato¹
Africada fricativa + plosiva	Sonora				`[dʒ]` dia²
Africada fricativa + plosiva	Surda				`[tʃ]` tia², tchau
Aproximante interrupção parcial, insuficiente para criar turbulência	Sonora				`[ɹ]` parte³
Aproximante lateral (lateral = o ar passa pelos lados da língua)	Sonora			`[l]` lado		`[ʎ]` lhama
Vibrante simples (flap/tap) ar é interrompido brevemente uma única vez, sem pressão	Sonora			`[ɾ]` para, parte³
Vibrante múltipla (trill) ar causa vibração do órgão articulador, provocando múltiplas interrupções da corrente de ar	Sonora			`[r]` parte³, rato¹				`[ʀ]` rato¹

¹ A pronúncia do r inicial (e do rr) varia bastante entre regiões do país e entre indivíduos, e provavelmente há outras pronúncias não contabilizadas nessa tabela.

² As pronúncias ['dʒia] e [tʃia] são menos comuns no nordeste do país.

³ A pronúncia do r em final de sílaba também varia bastante. Pronúncias comuns incluem [ɾ] (vibrante simples), [r] (vibrante múltipla, imagino que mais comum no Rio Grande do Sul do que no resto do país), [x] (no sotaque carioca) e [ɹ] (o "r enrolado").

Esse diagrama só contém as consoantes usadas no português do Brasil. Como diversão, você pode experimentar pronunciar os sons correspondentes às regiões em branco por analogia. (Se você olhar o diagrama do IPA, verá que algumas regiões estão pintadas de cinza, o que indica que acredita-se que não seja possível pronunciar uma consoante com o ponto e modo de articulação indicados pela região, mas você pode considerar isso como um desafio.)

Vogais

No diagrama de vogais do IPA, as vogais estão dispostas segundo três características: abertura (openness) ou altura (height), i.e., quanto espaço há entre a língua e o céu da boca; "profundidade" (backness), i.e., a posição da língua na boca com relação ao eixo frente-trás; e arredondamento (rounding), i.e., se a vogal é pronunciada com os lábios arredondados ou não.

Se você pronunciar a, é, ê, i em seqüência, perceberá que o espaço entre a língua e o céu da boca vai ficando gradativamente menor: essa é a variação de altura que o diagrama descreve. Essas quatro vogais são transcritas [a] (aberta), [ɛ] (média-aberta), [e] (média-fechada), [i] (fechada).

Se você agora pronunciar a, ó, ô, u em seqüência, perceberá a mesma variação de abertura, mas também perceberá que a língua permanece mais próxima da parte de trás da boca do que com é, ê, i. Essa variação é a "profundidade" (backness) da vogal: [ɛ], [e], [i] são anteriores (front) ou semi-anteriores (near front), enquanto [ɔ], [o], [u] são posteriores (back).

Se você pronunciar é, ó, ê, ô, i, u em seqüência, perceberá que além da diferença de backness, a posição dos lábios alterna entre "simples" e arredondada. Essa variação é o arredondamento da vogal.

Uma outra propriedade das vogais relevante para o português é a nasalização, i.e., se a passagem do ar pelo nariz é livre ou não. Nasalização à parte, há oito vogais no português brasileiro:

[a], aberta, anterior, não-arredondada: pato.
[ɐ], semi-aberta, central, não-arredondada: cana.
[ɛ], média-aberta, anterior, não-arredondada: bela.
[e], média-fechada, anterior, não-arredondada: cabelo.
[i], fechada, anterior, não-arredondada: lira.
[ɔ], média-aberta, posterior, arredondada: bola.
[o], média-fechada, posterior, arredondada: soro.
[u], fechada, posterior, arredondada: muro.

A nasalização é indicada pelo til: <mãe> ['mɐ̃i̯].

Semivogais

As vogais fechadas (e.g., [i], [u] em português) restringem tanto a passagem do ar que em certas condições esses fones podem se comportar como consoantes aproximantes, ocorrendo fora do núcleo silábico (e.g., mau, pai, Paraguai). Nesses casos, elas são denominadas semivogais. Semivogais podem ser indicadas ou com um diacrítico (['mau̯], ['pai̯]) ou com símbolos específicos para as semivogais (['maw], ['paj]), dependendo de se a análise (a.k.a. humor) do lingüista trata esses sons como vogais ou como consoantes. Em uma transcrição "broad", se não houver confusão, pode-se simplesmente omitir o diacrítico e usar o símbolo da vogal comum (isso é particularmente comum em transcrições do inglês: <say> ['seɪ]).

[puɾ 'oʒi̯ɛ 'sɔ]

E ficamos por aqui. Espero que este post tenha servido para explicar os conceitos básicos por trás do IPA. Para mais informações, consulte o artigo da Wikipédia (ou deixe um comentário e eu me arrisco a responder).

Computers, languages, and computer languages. Às vezes em Português, sometimes in English.

Posts com a tag: lang