Home arrow Business Intelligence arrow Produkte arrow BI mit Microsoft SQL Server arrow Data Mining mit Analysis Services  

 beratung

 

 

telefonnu

 

 

termin_vereinbaren  

 

 

 anfrage_button  

 

 

lastminuteangebote
 
 

Ansprechpartner BI

Fachlicher Ansprechpartner:

Markus Schwienbacher (Dipl.-Inf. Univ)
Senior Manager
Fachbereichsleiter Business Intelligence

Tel.: (09 11) 98 89 - 0

Kundenbetreuung - Vertrieb:

Ralf Heumann
Leitung Key Account Management

Tel.: (09 11) 98 89 - 180

Postanschrift:

it innovations GmbH
Thomas-Mann-Str. 59
90471 Nürnberg

Diese E-Mail Adresse ist gegen Spam Bots geschützt, Sie müssen Javascript aktivieren, damit Sie sie sehen können

 

Trainer Login






Passwort vergessen?
Noch kein Benutzerkonto?
Registrieren

Erstellen eines Data Mining Modells mit dem SQL Server 2005

Der Prozess des Modellerstellens, -trainierens und –testens ist der schwierigste Teil beim Erstellen der Anwendung. Tatsächlich besteht das Erstellen der Anwendung in Programmierarbeit. Bevor mit dem Erstellen eines Data Mining-Modells begonnen wird, sollten die Daten gesammelt und bereinigt worden sein, am besten in einem Data Warehouse.

SQL Server 2005 Data Mining kann sowohl auf Daten aus einer relationalen Datenbank, als auch auf Daten aus Analysis Services-Cubes zugreifen.

Der Entwickler eines Data Mining-Modells sollte über Erfahrung im unternehmerischen Bereich und im technischen Bereich verfügen. Er wird von seinen Kenntnissen in Statistik profitieren, die wichtigsten wirtschaftlichen Probleme von Unternehmen verstehen und Daten und Beziehungen mit Neugierde begegnen. Auch wird er in der Lage sein, mit den Werkzeugen von SQL Server 2005 Daten zu bearbeiten und zu speichern. Das Mitglied eines Data Warehouse-Teams wird diese Bedingungen am wahrscheinlichsten erfüllen.

Wenn Sie ein Neuling sind, sollten Sie einige Wochen einplanen, um sich beim Entwickeln eines Prototypen-Modells mit den Daten, Werkzeugen und verschiedenen Algorithmen vertraut zu machen. Arbeiten Sie auf einem Entwicklungsserver, auf dem Sie Administratoren-Rechte besitzen.

 

Die ersten Schritte in der Modellerstellung sind explorativ: sie sollten Daten mehrmals neu strukturieren und mit verschiedenen Herangehensweisen experimentieren. Arbeiten Sie anfangs mit einer kleinen Datenteilmenge, die Sie erweitern, wenn Sie eine klarere Vorstellung von dem Entwurf Ihres Modells bekommen. Kümmern Sie sich in der Prototyp-Phase nicht darum, ob ihre Anwendung produktionsreif ist. Verwenden Sie Integration Services oder jedes andere ihnen angenehme Werkzeug, um die nötigen Datenbearbeitungen durchzuführen. Protokollieren Sie alle nötigen Transformationen, aber gehen Sie nicht davon aus, dass etwas von dem, was Sie tun, Bestandteil der endgültigen Anwendung werden wird.

Sie sollte zwei Datensätze vorbereiten, den einen zum Entwickeln der Modelle und den anderen, um die Genauigkeit der Modelle zu testen, um so das passenste Modell für Ihr Geschäftsproblem wählen zu können. Achten Sie bei der Zusammenstellung der Daten darauf, die Daten nicht schon zu beurteilen. Wählen Sie beispielsweise jeden zehnten Kunden aus, oder teilen sie die Daten nach dem Anfangsbuchstaben des Nachnamens oder eines anderen beliebigen Attributs auf.

 

Das Erstellen eines Data Mining-Modells besteht daraus, Entscheidungen zu treffen:

· Eingabedatensatz,

· Eingabefelder,

· Data Mining-Algorithmus, und

· Parameter, die während der Berechnung des Algorithmus verwendet werden.

 

 

Wenn Sie sich nicht sicher sind, welcher Parameter für Ihr Unternehmensproblem der geeignetste ist, sollte Sie zu Untersuchen der Daten mit Decision Trees oder Naïve Bayes beginnen.

 

 

Wenn Sie unsicher sind, welche Attribute Sie berücksichtigen sollten, wählen Sie alle aus. Verwenden Sie die Abhängigkeitsnetzwerk-Ansicht, die Ihnen helfen wird, ein komplexes Modell zu vereinfachen.Während der Entwicklungsphase des Prototypen können Sie verbundene Modelle erstellen, um den besten Algorithmus und das beste Modell zu ermitteln. Verwenden Sie die das Mininggenauigkeits-Diagramm, um das für die Vorhersage am besten geeignete Modell zu ermitteln. Auch empfiehlt es sich, verbundene Modelle zu erstellen, um verschiedene Arten der Analyse an den gleichen Daten auszuführen. Diese Modelle werden als verbundene Modelle schneller arbeiten als unabhängig voneinander definierte Modelle.

Nachdem Sie einen Prototypen erstellt und getestet haben, können sie das eigentliche Data Mining-Modell erstellen und testen. Wenn es nötig ist, die Daten vor ihrer Eingabe in das Data Mining-Modul zu transformieren, sollten Sie vorher einen entsprechenden produktionsreifen, funktionierenden Prozess erstellen. Sie können sich auch dafür entscheiden, das Mining-Modell direkt aus einer Integration Services-Pipeline zu bestücken. Wenn der Prototyp auf einer kleinen Datenteilmenge errichtet wurde, ist es nötig, alternative Modelle auf dem kompletten Trainingsdatensatz zu testen.