sexta-feira, 19 de junho de 2009

Novas Ferramentas: Lucene, Solr e Weka

Estou manipulando novas ferramentas de Processamento de Linguagem Natural, e entrando em contato com algumas outras para uso futuro, com o seguimento da pesquisa. Elas podem ampliar a funcionalidade do Gate, ou estender o escopo do tratamento de dados.

São elas:

Lucene: A high-performance, full-featured text search engine library
SOLR: An open source enterprise search server based on the Lucene Java search library, with XML/HTTP and JSON APIs, hit highlighting, faceted search, caching, replication, a web administration interface and many more features.
Weka: Weka is a collection of machine learning algorithms for data mining tasks. The algorithms can either be applied directly to a dataset or called from your own Java code. Weka contains tools for data pre-processing, classification, regression, clustering, association rules, and visualization. It is also well-suited for developing new machine learning schemes.
R: a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.

Além do bem conhecido banco de dados Oracle, na sua versão gratuita para Linux Ubuntu
O contato com estes softwares, além das temáticas da pesquisa em si, são um grande ganho deste pós-doutorado.

Nenhum comentário: