Fonte de informação sobre NLP


(Felipe Salvatore) #1

Para quem quer se informar sobre o que está rolando de mais novo em NLP vale a pena se inscrever nesse newsletter do Sebastian Ruder:

Eu tenho apreendido bastante por aqui. Se alguem tiver outro canal legal, eu aceito sugestões :smiley:


(Christian S. Perone) #2

Muito boa a dica ! Tem uma lista também com bastante paper importante da área nesse repositório.


(Humberto Marchezi) #3

Vale a pena olhar essa fonte sobre analise de sentimento em NLP composta por artigo + live demo + codigo-fonte. https://nlp.stanford.edu/sentiment/


(Abelardo Vieira Mota) #4

Lista de tasks de NLP com os estados da arte e repositórios: https://github.com/RedditSota/state-of-the-art-result-for-machine-learning-problems#nlp


(Felipe Salvatore) #5

Boa, não conhecia :grinning::grinning::grinning::grinning:


(Rogerio Bromfman) #6

Vocês conhecem fontes de estudos ou modelos sendo desenvolvidos para NLP em português? Preciso de um bom named-entity recognition para documentos em português, mas não consigo achar muitas fontes ou discussões a respeito.


(Christian S. Perone) #7

No Spacy tem o modelo pt_core_news_sm, tem um exemplo abaixo dele ali que ele executa no binder se você quiser testar.

Só adicionar o seguinte código embaixo depois de ele carregar o doc:

for ent in doc.ents:
    print(ent.text, ent.start_char, ent.end_char, ent.label_)

Você pode treinar ele também (mais detalhes aqui).


(Felipe Salvatore) #8

De cabeça me vem apenas umas dicas gerais:

  1. Tem um projeto famoso chamado Linguateca. Lá eles tem uma página sobre NER, mas fazem 8 anos que não é atualizado então talvez seja de pouca ajuda.

  2. Mande uma mensagem para o William Colen ele é um cara bem legal e um dos desenvolvedores do CoGrOO - um corretor gramatical acoplável ao LibreOffice, talvez ele saiba de algum NER.

  3. Para conhecer o que se está fazendo em NLP em portugues um bom lugar para se começar é vendo os pesquisadores ligados ao NILC de São Carlos, eles são muito bons.

  4. Acabou de ocorrer o PROPOR de um olhada nos papers aceitos para ver o que estão fazendo de NLP em portugues.


(Rogerio Bromfman) #9

Obrigado Christian. Já testei um pouco o Spacy e os resultados deixaram um pouco a desejar. Estou testando agora uma ferramenta de tageamento para aprimorar o modelo. É um processo bastante lento…


(Rogerio Bromfman) #10

Muito obrigado pelas dicas!! Vou olhar tudo com calma.