- 1. Introdução
- 2. Desafio
- 3. Avaliação
- 4. Pré-requisitos
- 5. Treinamento do modelo
- 6. Instância do Natural Language Understanding
- 7. Aplicação na nuvem
- 8. Submissão
O Programa Novas Rotas da Ingram Micro tem como foco estender o papel da Ingram como maior distribuidor de tecnologia do mundo, adicionando a capacidade de ser também um provedor de soluções. A iniciativa Novas Rotas da Ingram é quem está promovendo a parceria Ingram e IBM para o “Maratona behind the code”.
O Programa Novas Rotas traz um dos principais desafios do sistema judiciário brasileiro que está passando por uma transformação de ideologia, substituir a “cultura da sentença” pela “cultura da pacificação”. Atualmente para cada 10 novas demandas de processos, apenas 3 demandas anteriores são resolvidas. Esta diferença produz um déficit operacional de aproximadamente 115 milhões de processos jurídicos, onde cerca de 40% destas demandas não deveriam estar no âmbito judiciário e poderiam ser facilmente tratadas em etapa anterior para alcançar a resolução.
De forma inovadora estamos promovendo o chamado meios alternativos de resolução de conflitos, em inglês ADR (Alternative Dispute Resolution). Uma das caracterizações da ADR são as chamadas Soluções Online de Conflitos que segue como principal proposta deste desafio. Como o sistema judiciário possui um volume muito grande de processos, o objetivo é evitar novos custos pertinentes as posteriores etapas do processo judiciário e promover resoluções mais rápida atuando na fase de Mediação e Conciliação de disputas em vários casos.
Baseado neste contexto, a Ingram propõe a criação de um Mediador de Conflitos Cognitivo. O mediador do desafio visa acelerar o entendimento dos acordos da etapa de Mediação e Conciliação, acelerando o processo de homologação e execução dos acordos por parte do juiz de carreira.
Toda fase de Mediação e Conciliação se conclui com um termo de audiência do acordo a ser realizado. Este documento não possui uma padronização e tem sua complexidade variada. Atualmente, cada termo é lido e interpretado pelo juiz de carreira que analisa cada caso e dá a execução dos acordos entre os envolvidos.
O mediador de conflitos do desafio vai atuar auxiliando o juiz de carreira na leitura dos termos de audiência do acordo dos processos extrajudiciais. A ideia é extrair previamente, de cada processo, os seguintes elementos do termo de audiência do acordo:
- Título do conflito;
- Número do processo;
- Tipo de acordo;
- Termos do acordo, e;
- Nome das pessoas contidas no documento.
Portanto, este desafio consiste na criação de um modelo de anotação capaz de identificar e extrair os elementos acima dos termos de audiência do acordo e disponibilizá-los posteriormente para consulta do juiz de carreira.
Para realizar esta atividade, aconselhamos que o participante utilize a ferramenta Watson Knowledge Studio (WKS) e a API Natural Language Understanding (NLU). Para isto, de acordo com a base de documentos (exemplos de processos de conciliação e mediação) fornecida, cada participante deve criar seu próprio modelo de anotação de entidades e relacionamentos. É de responsabilidade do participante anotar estas informações no WKS.
Uma vez criado o modelo, através da API Watson Knowledge Studio, ele deve ser exportado (via Knowledge Studio
) e consumido pela API Natural Language Understanding
.
Os participantes terão que disponibilizar as credencias e o model id do seu Natural Language Understanding
. O avaliador automático irá enviar documentos de processos jurídicos e espera receber um JSON com a lista de entidades identificados pela solução. A lista de resposta será validada com a lista de resultados já esperados.
É mandatório criar as entidades no Knowledge Studio
com os seguintes nomes (e sguir):
Termo_acordo
Tipo_processo
Numero_processo
Titulo
Autor
Reu
Você deverá cumprir os seguintes itens:
- Registrar na Maratona Behind the Code e confirmar o e-mail de cadastro.
- Registrar na IBM Cloud e confirmar o e-mail de cadastro.
Veja o vídeo abaixo de como treinar o seu modelo de Natural Language Understanding
, usando Watson Knowledge Studio
(ou WKS).
- Crie uma instância de Watson Knowledge Studio, em
Dallas
e acesse a plataforma, clicando no botão "Launch Watson Knowledge Studio". - Descompacte e importe o seu dataset para o processo de
Annotation Task
. - Faço o treinamento por anotação nos documentos.
- Exporte o modelo para
Natural Language Understanding
, e copie oMODEL_ID
.
A API de Natural Language Understanding
utilizará o MODEL_ID
criado pelo Knowledge Studio
para analisar os textos com base no modelo criado.
🚨 SALVE AS CREDENCIAIS. VOCÊ IRÁ PRECISAR PARA SUBIR A APLICAÇÃO 🚨
Para pegar o IAM_APIKEY
(ou, em alguns casos, API Key
apenas), acesse o https://cloud.ibm.com/resources e veja na lista de Service
, você encontrará todos os serviços provisionados na sua conta (incluindo o Watson Assistant, Discovery, Watson Studio, Visual Recognition e Machine Learning. Todos os serviços dos desafios 1, 2, 3, 4 e 5).
Para subir a aplicação na IBM Cloud, você deve clicar no botão
abaixo para subir usando o IBM Continuous Delivery (também conhecido como Delivery Pipeline). Você deve subir a sua aplicação em Dallas.
🚨 CLIQUE PARA SUBIR A APLICAÇÃO NA IBM CLOUD 🚨
-
Configure o
Toolchain Name
com<maratona-id>-desafio6-behindthecode
, substituindo o<maratona-id>
pelo seu ID da Maratona (Ex: 100001). Se você não souber, verifique no seu e-mail, usado no registro da Maratona, para pegar o seu ID. -
Configure o
App name
com a mesmo valor usado no item 1. -
Crie uma chave (de uso interno). Basta clicar em "Create" e depois clique em "Create" novamente. Espere um instante até carregar todas os dados. Se demorar muito (mais de 5 minutos), recarregue a página e faça novamente o passo 1 e 2. Na parte superior, você pode deixar em Washington DC ou Dallas. Já na parte inferior (abaixo do item 2), é mandatório configurar a Região de Dallas.
Clique em Eclipse Orion Web IDE
para configurar a aplicação.
Abaixo está o passo-a-passo, obrigatório, para configurar a sua aplicação no Eclipse Orion Web IDE.
- Abra o arquivo
.env
para colocar as credenciais doNatural Language Understanding
e daMaratona
(lembre-se de que é o mesmo código usado para indicar novos participantes na Maratona). Preencha com os dados, após o=
(símbolo de igual).
# Credenciais para o Desafio 6
DESAFIO=6
MARATONA_ID=
# Natural Language Understanding
IAM_APIKEY=
MODEL_ID=
- Abra o arquivo
manifest.yml
e altere o<maratona-id>
com o seu ID da Maratona, o mesmo usado acima. Lembre-se: é mandatório ter a URL com o formato doname
, apresentado abaixo.
applications:
- name: <seu-id>-desafio6-behindthecode
memory: 256M
instances: 1
buildpack: sdk-for-nodejs
Clique em Create new launch configuration
e crie a configuração para a sua aplicação (que está sendo criada em background). Launch Config Name
, Application Name
e Host
devem ter o mesmo nome, com o formato <maratona-id>-desafio6-behindthecode
, igual nos itens anteriores. Clique em SAVE
para salvar as configurações.
Clique em PLAY
(primeiro botão na imagem). Espere até ficar verde
(com o status: running
). Depois, clique em Open
(terceiro botão na imagem). Vai abrir a sua aplicação, com as configurações implementadas.
🚨 TESTE BASTANTE O SEU MODELO DE TREINAMENTO 🚨
Mande vários textos para analisar, com base no seu treinamento. Faça quantos testes forem necessários e, se precisar, treine e re-treine o seu modelo para melhorar cada vez mais. Quando se sentir confortável, faça a submissão do seu desafio. Lembre-se: NÃO é possível submeter mais de uma vez. Fique atento!
Através da aplicação na IBM Cloud (https://<maratona-id>-desafio6-behindthecode.mybluemix.net
), você irá clicar no botão SUBMETER DESAFIO, preencher com o seu CPF e enviar para a avaliação final.
FIQUEM LIGADOS NO SITE DA MARATONA PARA ACOMPANHAR O RANKING GERAL E O RANKING DO DESAFIO! FIQUE NA TORCIDA PARA ESTAR ENTRE OS MELHORES!
-
No
Logs
da aplicação, apresentou um erro (em vermelho). O que pode ser?Resposta: Veja se você colocou as credenciais da Maratona, Watson Assistant e Machine Learning no arquivo
.env
e se o arquivomanifest.yml
está correto, conforme descrito acima. Veja se a sua aplicação está rodando na URL correta conforme descrito acima.
Acesse o slack e mande a sua dúvida: ibm.biz/convite-slack.
Copyright 2019 Maratona Behind the Code
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.