Nuno Chicória

ESTE ARTIGO EM 5 SEGUNDOS:

Este conteúdo é uma continuação do artigo: “Avaliação de soluções de Data Science: como criar modelos de machine learning“.
A monitorização contínua dos modelos é essencial para garantir o sucesso sustentado e o desempenho ideal dos modelos de machine learning, envolvendo a observação do comportamento de um modelo ao longo do tempo e o acompanhamento das principais métricas para garantir a precisão e a fiabilidade.
Várias plataformas open-source simplificam o ciclo de vida de machine learning, fornecendo ferramentas para o acompanhamento de experiências, o controlo de versões de modelos através de registos e a implementação perfeita com monitorização integrada, permitindo aos cientistas de dados enfrentar as complexidades da gestão de modelos para um sucesso sustentado.

No panorama dinâmico de Data Science, criar e implementar modelos de machine learning é apenas o começo. Para garantir um sucesso sustentado e um desempenho ótimo, a monitorização contínua destes modelos é crucial. A monitorização de modelos no pipeline de data science envolve o acompanhamento, a avaliação e a gestão do desempenho dos modelos experimentais e dos modelos implementados na produção.

Neste artigo, vamos aprofundar a importância da monitorização de modelos e explorar a forma como ferramentas como o MLflow podem permitir que os cientistas de dados acompanhem de perto as suas experiências e modelos implementados.

Compreender a monitorização de modelos

A monitorização de modelos refere-se ao processo contínuo de observação do comportamento de um modelo de machine learning ao longo do tempo, tanto durante a fase de desenvolvimento como após a implementação. Tal envolve o acompanhamento de várias métricas para garantir que o modelo continua a fornecer previsões precisas e fiáveis à medida que as distribuições de dados evoluem.

Aspetos-chave da monitorização de modelos

Métricas de desempenho

A monitorização do desempenho dos modelos envolve o acompanhamento de métricas importantes, como a exatidão, a precisão, o recall (recuperação), o F1 score, entre outras. Estas métricas fornecem informações sobre a forma como o modelo está a generalizar para novos dados e se ocorreu alguma degradação no desempenho.

Deteção de data drift

As distribuições de dados em cenários concretos raramente são estáticas. A monitorização da ocorrência de data drift envolve a comparação da distribuição de dados de entrada com os dados utilizados como base para o modelo. As ferramentas de monitorização permitem configurar processos automatizados para detetar e alertar quando ocorre um desvio significativo.

Deteção de model drift

À semelhança do data drift, o model drift envolve o acompanhamento de alterações nas previsões do modelo ao longo do tempo. As ferramentas de monitorização ativam o registo e a comparação do desempenho do modelo, permitindo identificar se a eficácia do modelo se degradou.

De que forma as ferramentas de monitorização de modelos facilitam a monitorização de modelos

Várias plataformas open source simplificam o ciclo de vida de machine learning. Uma abordagem fundamental é a capacidade de acompanhar e gerir experiências. Vejamos como estas ferramentas ajudam a manter os modelos sob controlo.

Experiment Tracking

Estas plataformas permitem registar e organizar experiências, facilitando a comparação de diferentes execuções e a identificação dos modelos mais bem sucedidos. Registam parâmetros, métricas e elementos, proporcionando uma visão global do seu processo de desenvolvimento de modelos.

Registo de modelos

Os registos de modelos funcionam como centros centrais para a gestão e o controlo de versões dos modelos. Isto garante que cada implementação se baseia numa versão específica do modelo, facilitando a reversão no caso de surgirem problemas.

Implementação e monitorização de modelos

Estas plataformas simplificam o processo de implementação, tornando fácil a transição da experimentação de modelos para a sua implementação na produção. Além disso, fornecem integrações com ferramentas de monitorização, permitindo acompanhar de perto o desempenho do modelo implementado.

Pensamentos finais

A monitorização de modelos é uma parte integrante do pipeline de data science que garante a eficácia contínua dos modelos de machine learning. Várias ferramentas, com o MLflow como exemplo, surgem como poderosos aliados, oferecendo funcionalidades que simplificam o acompanhamento de experiências, o controlo de versões de modelos e a monitorização da implementação. Ao tirar partido destas ferramentas, os cientistas de dados podem enfrentar com confiança as complexidades da gestão e monitorização de modelos, contribuindo para o sucesso sustentado dos seus esforços de machine learning.

Na Xpand IT, temos muito orgulho no nosso workflow XP4DS e gostamos de nos rodear de ferramentas que tornem o nosso trabalho mais simples e os nossos resultados melhores. Entre essas ferramentas, existe um local especial para o MLFlow.

Se ainda não ouviu falar do MLFlow, está na altura de conectar o seu modem do séc. XX porque está na altura de se familiarizar com o mundo tecnológico!

MLFlow é uma ferramenta open-source que ajuda a fazer a gestão do ciclo de vida de uma experiência de machine learning desde o treino do primeiro modelo até ao modelo incrível que seguirá para produção e resolverá todos os problemas.

MLFlow abrange 3 grandes tópicos:

Tracking: guarda e faz queries sobre experiências (código, dados, configurações e resultados);
Projects: package para reproduzires experiências em qualquer plataforma;
Models: formato geral para fazer o deployment de modelos.

O MLFlow é agnóstico de qualquer biblioteca. Funciona com qualquer biblioteca de machine learning e em qualquer linguagem de programação sendo que todas as suas funções são acessíveis através de uma REST API e de CLI. O projeto também inclui uma Python API, R API e Java API.

1. Lembra-se com precisão do ROC AUC? (Métricas+ Log de Parâmetros)

Acontece aos melhores. Durante a primeira iteração obtemos um modelo com boas métricas de validação. Continuamos a iterar o modelo, esperançosos de que iremos encontrar um melhor conjunto de hiper parâmetros quando nos apercebemos que o melhor modelo era mesmo o primeiro. Ao fim de horas a queimar pestanas, é impossível lembrarmos-nos da primeira combinação de hiper parâmetros. Mas não mais! O MLFlow vem acabar com este problema. Com o registo de modelos, é possível encontrar num local toda a informação sobre esses mesmo modelos. Desde métricas de validação a hiper parâmetros, é até possível acrescentar tags personalizadas. Na API, é ainda possível comparar todos os modelos treinados e ordena-los por qualquer métrica ou tag à nossa escolha.

2. Funciona no seu computador ¯_(ツ)_/¯ (Log de Modelos + Ambiente de Trabalho)

Enquanto Data Scientist, criamos um modelo incrível que resolve todos os problemas. No entanto, quando o fazemos chegar aos nossos colegas, o mesmo não funciona. Pode ser uma biblioteca que precisa de ser atualizada ou simplesmente algum bruxedo que está a acontecer no background. Mais uma vez, MLFlow salva o dia! Paralelo ao registo de métricas, é possível guardar o modelo (treinado), o conda environment, e qualquer outro ficheiro que achemos importante. Desta maneira, os nossos colegas não terão qualquer problema em replicar a nossa experiência.

3. Para além das experiências (Registo de Modelos)

Da mesma maneira que é possível fazer o log de modelos a cada experiência, cada modelo que esteve em produção pode também ser guardado. Através da UI do MLFlow é possível aceder a todas as versões do modelo que está em deployment. Ainda mais importante, quando escolhemos o melhor modelo para produção, é possível regista-lo de forma a que toda a equipa saiba que é aquele o modelo que seguirá para staging e produção.

4. Não existe espaço para Lone Wolves no MLFlow (Trabalho de Equipa)

MLFlow leva o termo “trabalho de equipa” até ao próximo nível aumentando tanto o trabalho dentro da equipa e entre equipas. Para a equipa de Data Science, cada membro pode submeter e ver os modelos submetidos por cada membro, fazer comparações entre modelos e importar modelos dos colegas. Enquanto equipa, podem também colocar em staging o modelo que acham melhor para produção. Estes terão de ser aprovados e validados pela equipa responsável por essas tarefas. Com isto, todo o pipeline de DS está presente no MLFlow.

5. Modelo está pronto! (Deployment para Produção)

O fim está próximo. Vê a luz ao fundo do túnel e todo aquele trabalho está prestes a ser recompensado. Só falta fazer o deployment do modelo e, mais uma vez, o MLFlow tem a solução. Com MLFlow Models estamos preparados para enviar o modelo treinado para deployment em qualquer plataforma. Isto, combinado com a ferramenta de logging, cria a ferramenta perfeita para uma monitorização constante da performance dos modelos ao longo do tempo para que seja possível alterar o modelo, caso necessário!

Conclusão

Como se tornou evidente, o MLFlow é uma ferramenta que procura resolver (e com grande sucesso) muitos dos problemas que o Data Scientist enfrenta durante a sua rotina diária de trabalho. Desde o primeiro momento em que treinamos um modelo ao momento em que este entra em produção, o MLFlow é uma ferramenta com a qual podemos contar para tornar todo o processo de Data Science muito mais fácil. Sendo open source, o MLFlow é uma ferramenta que evolui a cada dia que passa e uma ferramenta essencial para o Data Scientist do século XXI!

Cookie	Duração	Descrição
_GRECAPTCHA	5 meses 27 dias	Este cookie é configuirado pelo Google reCAPTCHA protege o nosso site contra ataques de spam nos formulários de contacto.
_icl_visitor_lang_js	1 dia	Este cookie é configurado pelo WPML WordPress plugin guarda o idioma redirecionado.
cli_user_preference	1 ano	Este cookie é definido pelo plugin de Consentimento de Cookies GDPR e é usado para armazenar se o usuário consentiu ou não com o uso de cookies. Ele não armazena dados pessoais.
cookielawinfo-checkbox-[CATEGORIA]	11 months	Este cookie é usado pelo GDPR Cookie Consent plugin guarda o consentimento do visitante da [CATEGORIA].
CookieLawInfoConsent	1 ano	CookieYes define este cookie para registar o estado predefinido do botao correspondente a categoria e o estado do CCPA. Funciona apenas em coordenacao com o cookie principal.
PHPSESSID	sessão	Usado em aplicações PHP nativas, este cookie é usado para armazenar e identificar o ID de sessão exclusivo de um utilizador com a finalidade de gerir a sessão do mesmo no site. É um cookie de sessão e é excluído quando todas as janelas do navegador são fechadas.
viewed_cookie_policy	11 meses	Este cookie usado pelo GDPR Cookie Consent plugin para guardar se o visitante consentiu ou não o use the cookies. Não guarda nenhum dado pessoal.
viewed_cookies_policy	11 meses	Este cookie usado pelo GDPR Cookie Consent plugin para guardar se o visitante consentiu ou não o use the cookies. Não guarda nenhum dado pessoal.
wpml_browser_redirect_test	sessão	Este cookie é usado pelo WPML WordPress plugin é usado para testar se os cookies estão ativos no browser.

Cookie	Duração	Descrição
__cf_bm	30 minutos	Este cookie é configurado pela CloudFlare para dar suporte ao Cloudflare Bot Management
_os_session	14 days	Este cookie não contém nenhuma informação específica do utilizador.
abgroups	1 mês	Ativa o grupo A ou B para o teste A/B de funcionalidades.
brighsprout_auth_provider_session	2 horas	Brigh Sprout set's this cookie.
bscookie	2 anos	Este cookie é usado pelo LinkedIn guarda se o utlizador fez login com multi-factor
CONSENT	2 anos	Este cookie é usado pelo YouTube em videos embebidos e regista dados estatísticos anonimamente.
cxssh_status	3 meses 8 dias	Este cookie determina se o navegador aceita cookies.
lang	sessão	Este cookie é usado pelo LinkedIn para guardar a escolha do idioma do visitante no website linkedin.com.
language	session	Este cookie é usado para guardar a escolha no nosso website.
li_gc	2 anos	Utilizado pelo LinkedIn para armazenar o consentimento dos visitantes em relação ao uso de cookies para fins não essenciais.
lidc	1 dia	Este cookie é usado pelo LinkedIn para facilitar a escolha do datacenter.
ln_or	1 dia	Cookie usada pelo LinkedIn.
VISITOR_INFO1_LIVE	5 meses 27 dias	Este cookie usado pelo YouTube para medir a largura de banda de modo a determinar se o visitante acede à nova ou à antiga interface.
XSRF-TOKEN	2 horas	Wix set this cookie for security purposes and this cookie is written to help with site security in preventing Cross-Site Request Forgery attacks.
yt-remote-connected-devices	nunca	Este cookie é usado pelo YouTube para guardar as preferências de video do visitante nos videos embebidos.
yt-remote-device-id	nunca	Este cookie é usado pelo YouTube para guardar as preferências de video do visitante nos videos embebidos.

Cookie	Duração	Descrição
__adroll	1 ano 1 mes	Este cookie e definido pela AdRoll para identificar utilizadores em visitas e dispositivos diferentes. e utilizado em leiloes em tempo real para que os anunciantes possam exibir anuncios relevantes.
__adroll_fpc	1 ano	A AdRoll define este cookie para segmentar utilizadores com base no comportamento de navegacao.
__adroll_shared	1 ano 1 mes	A AdRoll define este cookie para recolher informacoes sobre utilizadores em diferentes websites para publicidade relevante.
__ar_v4	1 ano	Este cookie e definido sob o dominio DoubleClick para colocar anuncios que direcionam para o website nos resultados de pesquisa do Google e para monitorizar as taxas de conversao desses anuncios.
__rd_experiment_version	sessao	Este cookie monitoriza o comportamento do utilizador nos formulários da RD, contribuindo para a criação de relatórios analíticos sobre os mesmos.
_clck	1 ano	A Microsoft Clarity define este cookie para reter o ID do Utilizador Clarity do navegador e definicoes exclusivas para aquele website. Isso garante que as acoes realizadas durante visitas subsequentes ao mesmo website sejam associadas ao mesmo ID do utilizador.
_clsk	1 dia	A Microsoft Clarity define este cookie para armazenar e consolidar as visualizacoes de pagina de um utilizador numa unica sessao de gravacao.
_fbp	3 meses	Este cookie é configurado pelo Facebook para exibir anúncios quando estiver no Facebook ou noutra plataforma digital onde é usada publicidade do Facebook
_ga	2 anos	Este cookie é configurado pelo Google Analytics, calcula dados de visitantes, sessões, campanhas e acompanha o uso do site. O cookie armazena informações anónimas atribuindo um número aleatório para distinguir visitantes únicos.
_ga_*	2 anos	Este cookie é configurado pelo Google Analytics é usado para distinguir os visitantes.
_gat	1 minuto	Este cookie é configurado pelo Google Analytics para limitar a taxa de pedidos e coleta de dados em sites de alto volume tráfego.
_gat_gtag_UA_*	1 minuto	Este cookie é configurado pelo Google Analytics usado para distinguir os visitantes.
_gat_UA-*	1 minuto	Este é configurado pelo Google Analytics, onde o elemento padrão no nome contém um número que identifica o site. É uma variação do cookie _gat usado para limitar a quantidade de dados registados pelo Google em sites de alto volume de tráfego.
_gcl_au	3 meses	O Google Tag Manager define o cookie para experimentar a eficiencia de publicidade em websites que utilizam os seus servicos.
_gd*	sessão	Este cookie é configurado pelo Google Analytics é usado para distinguir os visitantes.
_gid	1 dia	Este cookie é configurado pelo Google Analytics guarda um ID único que é usado para gerar dados estatísticos sobre como o visitante usa o site
_hjAbsolutesessaoInProgress	30 minutos	O Hotjar define este cookie para detetar a primeira visualizacao da pagina de um utilizador, que e um sinal Verdadeiro/Falso definido pelo cookie.
_hjFirstSeen	30 minutos	O Hotjar define este cookie para identificar a primeira sessao de um novo utilizador. Ele armazena o valor verdadeiro/falso, indicando se foi a primeira vez que o Hotjar viu este utilizador.
_hjIncludedInsessaoSample_*	2 minutos	O Hotjar define este cookie para determinar se um utilizador está incluído na amostragem de dados definida pelo limite diário de sessões do seu site.
_hjRecordingEnabled	nunca	O Hotjar define este cookie quando uma gravacao comeca e e lido quando o modulo de gravacao e inicializado, para verificar se o utilizador ja esta numa gravacao numa sessao especifica.
_hjRecordingLastActivity	nunca	O Hotjar define este cookie quando uma gravacao de utilizador comeca e quando os dados sao enviados atraves do WebSocket.
_hjsessao_*	30 minutos	O Hotjar define este cookie para garantir que os dados de visitas subsequentes ao mesmo site sejam atribuidos ao mesmo ID de utilizador, que persiste no ID de Utilizador Hotjar, unico para esse site.
_hjsessaoUser_*	1 ano	O Hotjar define este cookie para garantir que os dados de visitas subsequentes ao mesmo site sejam atribuidos ao mesmo ID de utilizador, que persiste no ID de Utilizador Hotjar, unico para esse site.
_te_	sessao	O Grupo Adroll regista um ID unico que identifica o dispositivo de um utilizador que regressa. O ID e utilizado para anuncios direcionados.
319af4c0-e197-4de9-8a9b-fe98c8a2ca04	sessão	O Dynamics 365 Marketing usa esta cookie para agrupar todos os carregamentos de página por um determinado visitante que são registrados pelo mesmo script de análise comportamental e que ocorrem dentro do prazo configurado. Ele considera tudo isto como parte de uma única visita no site.
79f08280-5c63-4331-b04d-fb6f39afda51	2 anos	Esta cookie permite que o Dynamics 365 Marketing pontue leads com base no nível de interação em um determinado site. Não contém informações pessoais, mas identifica exclusivamente um navegador específico em uma máquina específica, e o Dynamics 365 Marketing pode usá-lo para correlacionar essa ID com um contacto real na base de dados do Dynamics 365 Marketing.
AnalyticsSyncHistory	1 mês	Este cookie é usado pelo Linkedin para guardar informação sobre quando ocorreu a sincronização com o cookie lms_analytics para os visitantes dos países selecionados.
anj	3 meses	A AppNexus define o cookie anj, que contem dados sobre se um ID de cookie esta sincronizado com parceiros.
ANONCHK	10 minutos	O cookie ANONCHK, definido pelo Bing, e usado para armazenar o ID da sessao do utilizador e verificar os cliques em anuncios no motor de busca Bing. O cookie ajuda na geracao de relatorios e personalizacao.
bcookie	2 anos	Este cookie é usado pelo LinkedIn adiciona tags quando são usados os botões "share" do Linkedin para identificar o browser.
browser_id	5 anos	Este cookie é usado para identificarmos o browser do visitante quando voltar a visitar o website.
CLID	1 ano	Usada pelo Microsoft Clarity, o objetivo desta cookie é gerar um mapa de calor e uma gravação da sessão.
CMID	1 ano	A Casale Media define este cookie para recolher informacoes sobre o comportamento do utilizador para publicidade direcionada.
CMPRO	3 meses	A CasaleMedia define o cookie CMPRO para rastreamento anonimo de utilizacao e publicidade direcionada.
CMPS	3 meses	A CasaleMedia define o cookie CMPS para rastreamento anonimo de utilizadores com base nas visitas ao website, exibindo anuncios direcionados.
fr	3 meses	Este cookie é usado pelo Facebook permite mostrar anúncios relevantes aos visitantes, analisando o comportamento do visitante noutros websites que possuem pixel do Facebook ou o plugin social do Facebook.
IDE	1 ano 24 dias	Os cookies Google DoubleClick IDE armazenam informacoes sobre como o utilizador utiliza o website para apresentar anuncios relevantes de acordo com o perfil do utilizador.
KRTBCOOKIE_*	3 meses	A Pubmatic define este cookie para registar um ID unico que identifica o dispositivo do utilizador em visitas posteriores a websites que utilizam a mesma rede de anuncios.
li_sugr	3 meses	O LinkedIn define este cookie para recolher dados sobre o comportamento do utilizador, otimizando o website e tornando os anuncios no website mais relevantes.
MR	7 dias	Este cookie, definido pelo Bing, e usado para recolher informacoes do utilizador para fins de analise.
msd365mkttr	2 anos	O Microsoft Dynamic 365 guarda informações sobre o comportamento do utilizador em vários sites. Esta informação é usada para otimizar a relevância do anúncio no site.
msd365mkttrs	sessão	Permite a utilização de um formulário específico, que envia os dados preenchidos pelo utilizador para o Microsoft Dynamic 365.
MUID	1 ano	Identifica os navegadores que visitam os sites da Microsoft. Estes cookies são usados para análise de sites e outras finalidades operacionais.
PugT	1 mes	A PubMatic define este cookie para verificar quando os cookies foram atualizados no navegador, a fim de limitar o numero de chamadas ao armazenamento de cookies no lado do servidor.
scribd_ubtc	10 anos	A Scribd define este cookie para recolher dados sobre o comportamento do utilizador em varios websites e maximizar a relevancia dos anuncios no website.
SM	sessao	O cookie da Microsoft Clarity define este cookie para sincronizar o MUID em dominios Microsoft.
SRM_B	1 ano 24 dias	Usado pela Microsoft Advertising como um ID unico para visitantes.
test_cookie	15 minutos	O doubleclick.net define este cookie para verificar se o navegador do utilizador suporta cookies.
UserMatchHistory	1 mês	Este cookie usado pelo LinkedIn para sincronizar os ID dos Ads.
uuid2	3 meses	O cookie uuid2 e definido pela AppNexus e regista informacoes que ajudam a distinguir entre dispositivos e navegadores. Essas informacoes sao usadas para selecionar anuncios entregues pela plataforma e avaliar o desempenho do anuncio e seu pagamento atribuido.
VISITOR_PRIVACY_METADATA	5 meses 27 dias	Cookie utilizado pelo YouTube para rastrear e enriquecer as configurações de privacidade dos utilizadores na plataforma do YouTube.
vuid	2 anos	Este cookie é configurado pelo Vimeo guarda informação através dos vídeos embebidos, posteriormente permitem rastrear o visitante através de um ID único.
YSC	sessão	Este cookie é usado pelo Youtube para guardar as visualizações de videos do youtube embebidos em páginas.
yt.innertube::nextId	nunca	Este cookie é usado pelo YouTube regista um ID único para guardar quais os vídeos que o visitante visualizou.
yt.innertube::requests	nunca	Este cookie é usado pelo YouTube regista um ID único para guardar quais os vídeos que o visitante visualizou.

Search

Nuno Chicória

ngpc

Guia para a monitorização de modelos de machine learning

ESTE ARTIGO EM 5 SEGUNDOS:

Compreender a monitorização de modelos