sexta-feira, 26 de junho de 2009

Lyon - 7ème colloque du chapitre français de l’ISKO

Chegamos ontem e apresentei hoje meu trabalho no 7ème colloque du chapitre français de l’ISKO. Apesar de um pouco sem graça de ter sido um dos pouquíssimos a apresentar em Inglês num grupo composto eminentemente de franceses, a apresentação foi muito bem recebida e fizeram muitas perguntas...



Depois coloco fotos da (bela) cidade.
Um abraço!

sexta-feira, 19 de junho de 2009

Reflexões sobre o processo de pesquisa...

O processo de pesquisa pode ser extremamente prazeroso, quando somos recompensados pelas respostas e resultados que tanto perseguimos após o esforço dispendido.

Em compensação, pode ser também um processo moroso, com muitas idas e vindas.
A pesquisa empírica, como a que estou envolvido, é por vezes desgastante. Certos resultados fazem a análise convergir, apontando para os tão sonhados modelos e metodologias...



Outros, entretanto, apontam mais a mais caminhos divergentes que nos obrigam a tomar decisões. Estas implicam no abandono de uma ou de várias possibilidades, sem a garantia de que escolhemos o caminho certo...



Isso lembra o poema de Robert Frost, reproduzido abaixo:

The Road Not Taken

Two roads diverged in a yellow wood,
And sorry I could not travel both
And be one traveler, long I stood
And looked down one as far as I could
To where it bent in the undergrowth;

Then took the other, as just as fair,
And having perhaps the better claim,
Because it was grassy and wanted wear;
Though as for that the passing there
Had worn them really about the same,

And both that morning equally lay
In leaves no step had trodden black.
Oh, I kept the first for another day!
Yet knowing how way leads on to way,
I doubted if I should ever come back.

I shall be telling this with a sigh
Somewhere ages and ages hence:
Two roads diverged in a wood, and I—
I took the one less traveled by,
And that has made all the difference.

E mais ferramentas: LAMP

Após duas tentativas frustradas de analisar dados em Bancos de Dados Relacionais (Postgres e Oracle, que são "nativos" ao GATE), estou partindo para uma terceira tentativa: usar o pacote LAMP (Linux, Apache 2, PHP5 e MySQL), administrado pelo PHPMyAdmin.

Vamos ver se vai dar certo... estou extraindo instâncias sintáticas como os sintagmas nominais e verbais do corpus Oasis e preciso fazer queries sobre os resultados, o que - até agora - não tenho conseguido a contento...

EDIBCIC

Tive dois trabalhos (em parceria com o Maurício) aprovados no evento EDIBCIC em Portugal.
O programa do evento pode ser conferido aqui
Isso significa que terei que voltar à Coimbra em Novembro... nada mal!

Novas Ferramentas: Lucene, Solr e Weka

Estou manipulando novas ferramentas de Processamento de Linguagem Natural, e entrando em contato com algumas outras para uso futuro, com o seguimento da pesquisa. Elas podem ampliar a funcionalidade do Gate, ou estender o escopo do tratamento de dados.

São elas:

Lucene: A high-performance, full-featured text search engine library
SOLR: An open source enterprise search server based on the Lucene Java search library, with XML/HTTP and JSON APIs, hit highlighting, faceted search, caching, replication, a web administration interface and many more features.
Weka: Weka is a collection of machine learning algorithms for data mining tasks. The algorithms can either be applied directly to a dataset or called from your own Java code. Weka contains tools for data pre-processing, classification, regression, clustering, association rules, and visualization. It is also well-suited for developing new machine learning schemes.
R: a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.

Além do bem conhecido banco de dados Oracle, na sua versão gratuita para Linux Ubuntu
O contato com estes softwares, além das temáticas da pesquisa em si, são um grande ganho deste pós-doutorado.