Introduction au data mining
Présentation du livre
Le data mining est un ensemble d’outils permettant une analyse de haut niveau de données disparates accumulées par l’entreprise pour l’aider à déterminer sa stratégie et guider les décisions qui en découlent.
Les auteurs resituent ce domaine dans un champ beaucoup plus
large auquel toutes les entreprises sont confrontées aujourd’hui : l’intégration et la gestion de masses d’informations hétérogènes dans le processus de décision et, donc, la maitrise du data mining à laquelle ces outils contribuent.
C’est cette logique qui structure le contenu de l’ouvrage où, après avoir défini dans un premier chapitre à valeur introductive ce qu’est le data mining (exploration heuristique des données), les chapitres suivants présenteront l’essentiel des méthodes et outils répondant aux différents objectifs analytiques visant, soit la logique et la compréhension des liens observés entre variables (dimension descriptive), soit la prise de décision (dimension prédictive d’un comportement).
Sommaire de l'ouvrage
1 Logique managériale de l’exploration des données
2 Transformer les données brutes en variables – les classes de variables
3 Méthodes pour découvrir les « informations cachées », les structurer et les comprendre
Les analyses factorielles métriques et non métriques
Les méthodes associant simultanément plusieurs types de variables
4 Méthodes de partitionnement préparatoire à l’analyse prédictive
Les techniques de classification (typologie)
Les techniques de segmentation
5 Méthodes d’aide à la prise de décision et à l’évaluation des modèles proposés
Les méthodes prédictives : les différentes techniques de régression adaptées à la nature des données
Le principe du « scoring » et l’évaluation des modèles de prévision construits.