Visualize dados não estruturados com Watson Natural Language Understanding
Por Guilherme Tanabe
28/01/2021 - 00:00•2 min de leitura
Imagem de Visualize dados não estruturados com Watson Natural Language Understanding no tecmundo
Por: Pavan Tummala, Richard Hagarty
Atualizado em: 28 de dezembro de 2018 | Publicado em: 27 de dezembro de 2018
Resumo
Neste padrão de código, criaremos um aplicativo da web para visualizar dados não estruturados usando Watson™ Natural Understanding, Apache Tika e D3.js. Depois que um usuário carrega um arquivo local de sua escolha, o aplicativo utiliza o Apache Tika para extrair texto do arquivo de dados não estruturados. O texto é então passado pelo Watson Natural Language Understanding, do qual entidades e conceitos são extraídos. Por fim, o aplicativo utiliza a biblioteca D3.js como ferramenta de visualização para mostrar os resultados ao usuário.
Descrição
O principal benefício de utilizar o Watson Natural Understanding Service é seu poderoso mecanismo de análise que fornece enriquecimento cognitivo e insights sobre os dados. Os principais enriquecimentos extraídos incluem:
-
Entidades – pessoas, empresas, organizações, cidades e muito mais;
-
Palavras-chave – tópicos importantes geralmente utilizados para indexar ou pesquisar os dados;
-
Conceitos – conceitos gerais identificados que não são necessariamente referenciados nos dados;
-
Sentimento – o sentimento geral positivo ou negativo dos dados.
Os enriquecimentos serão exibidos por meio do uso do D3.js, uma biblioteca JavaScript que fornece técnicas de visualização poderosas que ajudam a dar vida aos dados. Neste aplicativo, vamos utilizá-lo a fim de exibir cada um dos enriquecimentos em uma nuvem de bolhas interativa, com o tamanho e a localização de cada elemento determinados por seu relevância relativa.
Ao concluir este padrão de código, você entenderá como:
-
Criar e utilizar uma instância do Watson Natural Language Understanding;
-
Aproveitar o Apache Tika para extrair texto de arquivos não estruturados;
-
Utilizar o D3.js para exibir os visuais.
Fluxo
-
O usuário configura as credenciais para o serviço Watson Natural Language Understanding e inicia o aplicativo;
-
O usuário seleciona o arquivo de dados para processar e carregar;
-
O Apache Tika extrai o texto do arquivo de dados;
-
O texto extraído é passado para o Watson NLU para enriquecimento;
-
Os dados enriquecidos são visualizados na IU por meio da biblioteca D3.js.
Instruções
Pronto para começar? Consulte o README para obter instruções detalhadas.
Conclusão
Este padrão mostrou como criar um aplicativo da web para visualizar dados não estruturados utilizando Watson Natural Understanding, Apache Tika e D3.js. O padrão faz parte do caminho de aprendizagem Introdução ao processamento de linguagem natural. Para continuar com o caminho de aprendizagem, dê uma olhada na próxima etapa, Descubra insights de uso ocultos do Facebook.
...
Quer ler mais conteúdo especializado de programação? Conheça o IBM Blue Profile e tenha acesso a matérias exclusivas, novas jornadas de conhecimento e testes personalizados. Confira agora mesmo, consiga as badges e dê um upgrade na sua carreira!
…..
Quer dar o próximo grande passo na sua jornada profissional? Participe do Cloud Training, um curso online e gratuito que vai te preparar para o exame da certificação IBM Cloud Foundations. Inscreva-se já!