Leitfaden zu Überwachung von Machine Learning Modellen

5 SEKUNDEN ZUSAMMENFASSUNG:

Dieser Beitrag ist eine Fortsetzung des Artikels: „Data Science Assessment: Wie man Modelle für maschinelles Lernen erstellt“.
KontinuierlicheÜberwachung der Machine Learning Modelle ist unerlässlich, um den nachhaltigen Erfolg und die optimale Leistung von Modellen für maschinelles Lernen zu gewährleisten. Dazu gehört die Beobachtung des Verhaltens eines Modells im Laufe der Zeit und die Verfolgung wichtiger Kennzahlen, um Genauigkeit und Zuverlässigkeit zu gewährleisten.
Verschiedene Open-Source-Plattformen vereinfachen den Lebenszyklus des maschinellen Lernens, indem sie Tools für die Nachverfolgung von Experimenten, die Versionierung von Modellen durch Registrierungen und die nahtlose Bereitstellung mit integrierter Überwachung bereitstellen und so Datenwissenschaftler in die Lage versetzen, die Komplexität der Modellverwaltung zu bewältigen und einen nachhaltigen Erfolg zu erzielen.

In der dynamischen Landschaft der Datenwissenschaft ist die Erstellung und Bereitstellung von Machine Learning-Modellen nur der Anfang. Um einen dauerhaften Erfolg und eine optimale Leistung zu gewährleisten, ist eine kontinuierliche Überwachung dieser Modelle von entscheidender Bedeutung. Die Modellüberwachung in der Data-Science-Pipeline umfasst die Verfolgung, Bewertung und Verwaltung der Leistung sowohl von experimentellen Modellen als auch von Modellen, die in der Produktion eingesetzt werden.
In diesem Blogbeitrag gehen wir auf die Bedeutung der Modellüberwachung ein und untersuchen, wie Tools wie MLflow Datenwissenschaftler in die Lage versetzen können, ihre Experimente und eingesetzten Modelle genau im Auge zu behalten.

Modellüberwachung verstehen

Die Modellüberwachung bezieht sich auf den fortlaufenden Prozess der Beobachtung des Verhaltens eines maschinellen Lernmodells im Laufe der Zeit, sowohl während der Entwicklungsphase als auch nach der Bereitstellung. Dabei werden verschiedene Metriken verfolgt, um sicherzustellen, dass das Modell auch weiterhin genaue und zuverlässige Vorhersagen liefert, wenn sich die Datenverteilungen weiterentwickeln.

Schlüsselaspekte der Modellüberwachung

Leistungsmetriken

Die Überwachung der Leistung Ihrer Modelle umfasst die Verfolgung von Schlüsselkennzahlen wie Genauigkeit, Präzision, Wiedererkennung, F1-Score und mehr. Diese Metriken geben Aufschluss darüber, wie gut sich das Modell auf neue Daten verallgemeinern lässt und ob eine Verschlechterung der Leistung eingetreten ist.

Erkennung von Datendrift

Datenverteilungen in realen Szenarien sind selten statisch. Bei der Überwachung der Datenabweichung wird die Verteilung der eingehenden Daten mit den Daten verglichen, auf denen das Modell trainiert wurde. Mit Monitoring-Tools können Sie automatisierte Prozesse einrichten, um signifikante Abweichungen zu erkennen und zu melden.

Erkennung von Modelldrift

Ähnlich wie bei der Datenabweichung geht es bei der Modellabweichung darum, Veränderungen in den Vorhersagen des Modells im Laufe der Zeit zu verfolgen. Mit Hilfe von Überwachungswerkzeugen können Sie die Modellleistung protokollieren und vergleichen und so feststellen, ob die Effektivität des Modells nachgelassen hat.

Wie Modellüberwachungs-Tools die Modellüberwachung vereinfachen

Verschiedene Open-Source Plattformen vereinfachen den Lebenszyklus des maschinellen Lernens. Ein wichtiger Ansatz ist die Möglichkeit, Experimente zu verfolgen und zu verwalten. Im Folgenden erfahren Sie, wie diese Tools dabei helfen, Ihre Modelle zu überwachen:

Experiment Tracking

Diese Plattformen ermöglichen es Ihnen, Experimente zu protokollieren und zu organisieren, so dass Sie verschiedene Durchläufe leicht vergleichen und die erfolgreichsten Modelle identifizieren können. Sie zeichnen Parameter, Metriken und Artefakte auf und bieten so einen umfassenden Überblick über Ihren Modellentwicklungsprozess.

Modell Registrierung

Modellregistraturen dienen als zentrale Drehscheiben für die Verwaltung und Versionierung von Modellen. Dadurch wird sichergestellt, dass jede Bereitstellung auf einer bestimmten Version des Modells basiert, was ein einfaches Rollback ermöglicht, falls Probleme auftreten.

Modellimplementierung und Überwachung

Diese Plattformen vereinfachen den Bereitstellungsprozess und ermöglichen den nahtlosen Übergang vom Experimentieren mit Modellen zur Bereitstellung in der Produktion. Darüber hinaus bieten sie Integrationen mit Überwachungstools, mit denen Sie die Leistung des eingesetzten Modells genau im Auge behalten können.

Fazit

Die Modellüberwachung ist ein integraler Bestandteil der Data Science Pipeline, die die kontinuierliche Effektivität von Machine Learning-Modellen gewährleistet. Verschiedene Tools, wie z.B. MLflow, erweisen sich als leistungsstarke Verbündete und bieten Funktionen, die die Nachverfolgung von Experimenten, die Modellversionierung und die Überwachung der Bereitstellung optimieren. Durch den Einsatz dieser Tools können Datenwissenschaftler die Komplexität der Modellverwaltung und -überwachung selbstbewusst meistern und so zum nachhaltigen Erfolg ihrer Bemühungen im Bereich des maschinellen Lernens beitragen.

Nuno Chicória

Data Scientist – Xpand IT

Cookie	Dauer	Beschreibung
_GRECAPTCHA	5 Monate 27 Tage	Wird von Google reCAPTCHA verwendet, um unsere Website vor Spam-Anfragen in Kontaktformularen zu schützen.
_icl_visitor_lang_js	1 Tag	Wird vom WordPress-Plugin WPML verwendet. Der Zweck des Cookies ist, die weitergeleitete Sprache zu speichern.
cli_user_preference	1 Jahr	Dieses Cookie wird vom GDPR Cookie Consent-Plugin gesetzt und dient dazu zu speichern, ob der Nutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine persönlichen Daten.
cookielawinfo-checkbox-[CATEGORY]	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent-Plugin verwendet, um die Zustimmung des Benutzers zu den Cookies in der [CATEGORY] aufzuzeichnen.
CookieLawInfoConsent	1 jahr	CookieYes setzt dieses Cookie, um den Standardzustand der entsprechenden Kategorie und den Status von CCPA aufzuzeichnen. Es funktioniert nur in Verbindung mit dem Haupt-Cookie.
PHPSESSID	session	Wird bei nativen PHP-Anwendungen verwendet. Das Cookie wird verwendet, um die eindeutige Sitzungs-ID eines Benutzers zu speichern und zu identifizieren, um die Benutzersitzung auf der Website zu verwalten. Das Cookie ist ein Sitzungscookie und wird gelöscht, wenn alle Browserfenster geschlossen werden.
viewed_cookie_policy	11 Monate	Wird vom GDPR Cookie Consent Plugin verwendet, um zu speichern, ob der Nutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es werden keine persönlichen Daten gespeichert.
viewed_cookies_policy	11 Monate	Wird vom GDPR Cookie Consent Plugin verwendet, um zu speichern, ob der Nutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es werden keine persönlichen Daten gespeichert.
wpml_browser_redirect_test	session	Wird vom WPML-WordPress-Plugin verwendet und dient dazu, zu testen, ob Cookies im Browser aktiviert sind.

Cookie	Dauer	Beschreibung
__cf_bm	30 Minuten	Wird von Cloudflare verwendet und dient der Unterstützung des Cloudflare Bot Managements.
_os_session	14 Tage	Dieses Cookie enthält keine benutzerspezifischen Informationen.
abgroups	1 Monat	Aktiviert Gruppe A oder B für die A/B-Funktionalitätstestfunktion.
brighsprout_auth_provider_session	2 Std	Bright Sprout setzt dieses Cookie.
bscookie	2 Jahre	Verwendet von LinkedIn, um sich daran zu erinnern, dass ein eingeloggter Benutzer durch die Zwei-Faktor-Authentifizierung verifiziert ist.
CONSENT	2 Jahre	Wird von YouTube über eingebettete YouTube-Videos verwendet und registriert anonyme statistische Daten.
cxssh_status	3 Monate 8 Tage	Wird zurzeit analysiert und wurde noch keiner Kategorie zugeordnet.
lang	session	Wird von LinkedIn verwendet, um sich an die Spracheinstellung des Nutzers zu erinnern und sicherzustellen, dass LinkedIn.com in der Sprache angezeigt wird, die der Nutzer in seinen Einstellungen ausgewählt hat.
language	session	Dient zur Speicherung der Spracheinstellungen des Benutzers.
li_gc	2 Jahre	Wird von LinkedIn verwendet, um die Zustimmung der Gäste zur Verwendung von Cookies für nicht wesentliche Zwecke zu speichern.
lidc	1 Tag	Wird von LinkedIn verwendet, um die Auswahl des Datenzentrums zu erleichtern.
ln_or	1 Tag	Von LinkedIn verwendetes Cookie.
VISITOR_INFO1_LIVE	5 Monate 27 Tage	Wird von YouTube verwendet, um die Bandbreite zu messen, die bestimmt, ob der Nutzer die neue oder alte Player-Oberfläche erhält.
XSRF-TOKEN	2 Std	Wix setzt dieses Cookie aus Sicherheitsgründen, und dieses Cookie dient dazu, die Sicherheit der Website zu erhöhen, indem es Cross-Site Request Forgery-Angriffe verhindert.
yt-remote-connected-devices	nie	Wird von YouTube verwendet, um eine eindeutige ID zu registrieren und Daten darüber zu speichern, welche Videos von YouTube der Nutzer gesehen hat.
yt-remote-device-id	nie	Wird von YouTube verwendet, um eine eindeutige ID zu registrieren und Daten darüber zu speichern, welche Videos von YouTube der Nutzer gesehen hat.

Cookie	Dauer	Beschreibung
__adroll	1 jahr 1 monat	Dieses Cookie wird von AdRoll gesetzt, um Benutzer über Besuche und Geräte hinweg zu identifizieren. Es wird von Echtzeit-Gebotsverfahren für Werbetreibende verwendet, um relevante Anzeigen anzuzeigen.
__adroll_fpc	1 jahr	AdRoll setzt dieses Cookie, um Benutzer anhand ihres Surfverhaltens zu targetieren
__adroll_shared	1 jahr 1 monat	AdRoll verwendet dieses Cookie, um Informationen über Benutzer auf verschiedenen Websites zu sammeln, um relevante Werbung anzuzeigen.
__ar_v4	1 jahr	Dieses Cookie wird unter der Domain DoubleClick gesetzt, um Anzeigen zu platzieren, die in den Google-Suchergebnissen auf die Website verweisen, und um die Konversionsraten für diese Anzeigen zu verfolgen.
__rd_experiment_version	sitzung	Die Beschreibung ist derzeit nicht verfügbar.
_clck	1 jahr	Microsoft Clarity setzt dieses Cookie, um die Clarity-Benutzer-ID des Browsers und Einstellungen, die ausschließlich für diese Website gelten, zu speichern. Dies gewährleistet, dass Aktionen, die bei nachfolgenden Besuchen auf derselben Website durchgeführt werden, mit derselben Benutzer-ID verknüpft sind.
_clsk	1 day	Microsoft Clarity setzt dieses Cookie, um die Seitenaufrufe eines Benutzers in einer einzigen Sitzungsaufzeichnung zu speichern und zu konsolidieren.
_fbp	3 Monate	Wird von Facebook verwendet, um nach dem Besuch der Website entweder auf Facebook oder auf einer digitalen Plattform, die von Facebook-Werbung unterstützt wird, Werbung anzuzeigen.
_ga	2 Jahre	Wird von Google Analytics verwendet, um Besucher-, Sitzungs- und Kampagnendaten zu berechnen und die Nutzung der Website für den Analysebericht der Website zu verfolgen. Das Cookie speichert Informationen anonym und weist eine zufällig generierte Nummer zu, um eindeutige Besucher zu erkennen.
_ga_*	2 Jahre	Wird von Google verwendet, um Nutzer zu unterscheiden.
_gat	1 Minute	Wird von Google Universal Analytics verwendet, um die Anfragerate einzuschränken und so die Erfassung von Daten auf stark frequentierten Websites zu begrenzen.
_gat_gtag_UA_*	1 minute	Google Analytics setzt dieses Cookie, um eine eindeutige Benutzer-ID zu speichern.
_gat_UA-*	1 Minute	Wird von Google Analytics und Google Tag Manager verwendet, um Website-Besitzern zu ermöglichen, das Besucherverhalten zu verfolgen und die Leistung der Website zu messen. Das Musterelement im Namen enthält die eindeutige Identitätsnummer des Kontos oder der Website, auf die es sich bezieht.
_gcl_au	3 monate	Google Tag Manager setzt das Cookie, um die Effizienz von Werbung auf Websites zu testen, die ihre Dienste verwenden.
_gd*	session	Wird von Google Analytics zur Unterscheidung von Nutzern verwendet.
_gid	1 Tag	Wird von Google Analytics verwendet und registriert eine eindeutige ID, die verwendet wird, um statistische Daten darüber zu erstellen, wie der Besucher die Website nutzt.
_hjAbsoluteSessionInProgress	30 minuten	Hotjar setzt dieses Cookie, um die erste Pageview-Sitzung eines Benutzers zu erkennen, was eine True/False-Flagge ist, die durch das Cookie festgelegt wird.
_hjFirstSeen	30 minuten	Hotjar setzt dieses Cookie, um die erste Sitzung eines neuen Benutzers zu identifizieren. Es speichert den Wert True/False, der angibt, ob Hotjar diesen Benutzer zum ersten Mal gesehen hat.
_hjIncludedInSessionSample_*	2 minuten	Hotjar setzt dieses Cookie, um festzustellen, ob ein Benutzer in der von Ihrer Website festgelegten täglichen Sitzungsbegrenzung für die Datenauswahl enthalten ist.
_hjRecordingEnabled	niemals	Hotjar setzt dieses Cookie, wenn eine Aufzeichnung beginnt, und wird beim Start des Aufzeichnungsmoduls gelesen, um festzustellen, ob der Benutzer bereits in einer Aufzeichnung in einer bestimmten Sitzung ist.
_hjRecordingLastActivity	niemals	Hotjar setzt dieses Cookie, wenn eine Benutzer-Aufzeichnung beginnt und wenn Daten über das WebSocket gesendet werden.
_hjSession_*	30 minuten	Hotjar setzt dieses Cookie, um sicherzustellen, dass Daten von nachfolgenden Besuchen auf derselben Website der gleichen Benutzer-ID zugeordnet werden, die in der Hotjar-Benutzer-ID, die eindeutig für diese Website ist, erhalten bleibt.
_hjSessionUser_*	1 jahr	Hotjar setzt dieses Cookie, um sicherzustellen, dass Daten von nachfolgenden Besuchen auf derselben Website der gleichen Benutzer-ID zugeordnet werden, die in der Hotjar-Benutzer-ID, die eindeutig für diese Website ist, erhalten bleibt.
_te_	sitzung	AdRoll Group registriert eine eindeutige Kennung, die das Gerät eines wiederkehrenden Benutzers identifiziert. Diese Kennung wird für gezielte Werbung verwendet.
319af4c0-e197-4de9-8a9b-fe98c8a2ca04	session	Dynamics 365 Marketing verwendet dieses Cookie, um alle Seitenaufrufe eines bestimmten Besuchers zu gruppieren, die von demselben Skript für die Verhaltensanalyse aufgezeichnet werden und innerhalb des konfigurierten Zeitrahmens erfolgen. Alle diese Seitenaufrufe werden als Teil eines einzigen Besuchs der Website betrachtet.
79f08280-5c63-4331-b04d-fb6f39afda51	2 Jahre	Dieses Cookie ermöglicht es Dynamics 365 Marketing, Leads auf Grundlage ihrer Interaktion mit einer spezifischen Website zu bewerten. Das Cookie enthält keine persönlichen Informationen, identifiziert jedoch eindeutig einen bestimmten Browser auf einem bestimmten Gerät, und Dynamics 365 Marketing kann es verwenden, um diese ID mit einem tatsächlichen Kontakt in der Dynamics 365 Marketing-Datenbank zu verknüpfen.
AnalyticsSyncHistory	1 Monat	Wird von LinkedIn verwendet, um Informationen über den Zeitpunkt zu speichern, zu dem eine Synchronisierung mit dem lms_analytics-Cookie für Nutzer in den dafür vorgesehenen Ländern stattgefunden hat.
anj	3 monate	AppNexus setzt das anj-Cookie, das anzeigt, ob eine Cookie-ID mit Partnern synchronisiert ist.
ANONCHK	10 minuten	Das ANONCHK-Cookie, von Bing gesetzt, dient dazu, die Sitzungs-ID eines Benutzers zu speichern und Klicks auf Anzeigen in der Bing-Suchmaschine zu überprüfen. Das Cookie hilft bei Berichterstattung und Personalisierung.
bcookie	2 Jahre	Verwendet von LinkedIn, setzt dieses Cookie von LinkedIn Share Buttons und Ad Tags, um die Browser-ID zu erkennen.
browser_id	5 Jahre	Wird zur Identifizierung des Besucherbrowsers bei einem erneuten Besuch der Website verwendet.
CLID	1 Jahr	Verwendet von Microsoft Clarity. Das Cookie wird von eingebetteten Microsoft Clarity-Skripten gesetzt. Der Zweck dieses Cookies ist die Aufzeichnung von Heatmaps und Sitzungen.
CMID	1 jahr	Casale Media setzt dieses Cookie, um Informationen über das Benutzerverhalten für gezielte Werbung zu sammeln.
CMPRO	3 monate	CasaleMedia setzt das CMPRO-Cookie für anonyme Nutzungsverfolgung und gezielte Werbung.
CMPS	3 monate	CasaleMedia setzt das CMPS-Cookie für anonyme Benutzerverfolgung basierend auf den Website-Besuchen der Benutzer, um gezielte Anzeigen anzuzeigen.
fr	3 Monate	Wird von Facebook verwendet, um Nutzern relevante Werbung zu zeigen, indem das Nutzerverhalten im gesamten Web verfolgt wird, und zwar auf Websites, die über das Facebook-Pixel oder das Facebook Social Plugin verfügen.
IDE	1 jahr 24 tage	Google DoubleClick IDE-Cookies speichern Informationen darüber, wie der Benutzer die Website verwendet, um ihm relevante Anzeigen gemäß dem Benutzerprofil zu präsentieren.
KRTBCOOKIE_*	3 monate	Pubmatic setzt dieses Cookie, um eine eindeutige ID zu registrieren, die das Gerät des Benutzers bei Rückkehrbesuchen auf Websites identifiziert, die dasselbe Anzeigennetzwerk verwenden.
li_sugr	3 monate	LinkedIn setzt dieses Cookie, um Benutzerverhaltensdaten zu sammeln, die die Website optimieren und Anzeigen auf der Website relevanter machen.
MR	7 tage	Dieses Cookie, von Bing gesetzt, wird zur Sammlung von Benutzerinformationen zu Analysezwecken verwendet.
msd365mkttr	2 Jahre	Sammelt Informationen über das Nutzerverhalten auf mehreren Websites. Diese Informationen werden verwendet, um die Relevanz der Werbung auf der Website zu optimieren.
msd365mkttrs	session	Es ermöglicht die Verwendung eines speziellen Formulars, das die vom Nutzer ausgefüllten Daten an Microsoft Dynamic 365 sendet.
MUID	1 Jahr	Identifiziert eindeutige Webbrowser, die Microsoft-Websites besuchen. Diese Cookies werden für Werbung, Website-Analyse und andere betriebliche Zwecke verwendet.
PugT	1 monat	PubMatic setzt dieses Cookie, um zu überprüfen, wann die Cookies im Browser aktualisiert wurden, um die Anzahl der Aufrufe des serverseitigen Cookie-Speichers zu begrenzen.
scribd_ubtc	10 jahre	Scribd setzt dieses Cookie, um Daten zum Benutzerverhalten auf verschiedenen Websites zu sammeln und die Relevanz der Anzeigen auf der Website zu maximieren.
SM	sitzung	Microsoft Clarity setzt dieses Cookie, um die MUID über Microsoft-Domains hinweg zu synchronisieren.
SRM_B	1 jahr 24 tage	Verwendet von Microsoft Advertising als eindeutige ID für Besucher.
test_cookie	15 minuten	Doubleclick.net setzt dieses Cookie, um festzustellen, ob der Browser des Benutzers Cookies unterstützt.
UserMatchHistory	1 Monat	Wird von LinkedIn für die Synchronisierung von Anzeigen-IDs verwendet.
uuid2	3 monate	Das uuid2-Cookie wird von AppNexus gesetzt und enthält Informationen, die dazu dienen, zwischen Geräten und Browsern zu unterscheiden. Diese Informationen werden verwendet, um Anzeigen auszuwählen, die von der Plattform ausgeliefert werden, und die Anzeigenleistung und deren Attributzahlungen zu bewerten.
VISITOR_PRIVACY_METADATA	5 monate 27 tage	Cookie, das von YouTube verwendet wird, um die Datenschutzeinstellungen der Benutzer auf der YouTube-Plattform zu verfolgen und zu erweitern.
vuid	2 Jahre	Wird von Vimeo verwendet, um Tracking-Informationen zu sammeln, indem eine eindeutige ID zum Einbetten von Videos auf der Website festgelegt wird.
YSC	session	Wird von Youtube verwendet, um die Aufrufe von eingebetteten Videos auf Youtube-Seiten zu verfolgen.
yt.innertube::nextId	nie	Wird von YouTube verwendet, um die Videoeinstellungen des Nutzers zu speichern, der eingebettete YouTube-Videos verwendet.
yt.innertube::requests	nie	Wird von YouTube verwendet, um die Videoeinstellungen des Benutzers zu speichern, der ein eingebettetes YouTube-Video verwendet.

Search

Shortcodes Ultimate

Shortcodes Ultimate

Data Science

Leitfaden zu Überwachung von Machine Learning Modellen

5 SEKUNDEN ZUSAMMENFASSUNG:

Modellüberwachung verstehen

Schlüsselaspekte der Modellüberwachung

Leistungsmetriken

Erkennung von Datendrift

Erkennung von Modelldrift

Wie Modellüberwachungs-Tools die Modellüberwachung vereinfachen

Experiment Tracking

Modell Registrierung

Modellimplementierung und Überwachung

Fazit

Read more in

Search

Popular Posts

Tags

Portugal

Deutschland

Vereinigtes Königreich

Schweden

Lösungen

Technologien

Ressourcen & Neuigkeiten

Firma

Data Science

5 SEKUNDEN ZUSAMMENFASSUNG:

Modellüberwachung verstehen

Schlüsselaspekte der Modellüberwachung

Leistungsmetriken

Erkennung von Datendrift

Erkennung von Modelldrift

Wie Modellüberwachungs-Tools die Modellüberwachung vereinfachen

Experiment Tracking

Modell Registrierung

Modellimplementierung und Überwachung

Fazit

Share

Read more in

Data Science Assessment: how to analyse a project’s viability

Machine Learning model monitoring: types of drift

Data Science Assessment: how to create machine learning models

Search

Popular Posts

Tags

Wähle deinen Standort

Portugal

Portugiesisch

Deutschland

Deutsch

Vereinigtes Königreich

Englisch

Schweden

Englisch

Global

Englisch