Titre : | Big Data et Machine Learning : Les concepts et les outils de la data science |
Auteurs : | Pirmin Lemberger ; Marc Batty ; Médéric Morel ; Jean-Luc Raffaëlli |
Type de document : | Livre |
Mention d'édition : | 3e éd. |
Editeur : | Malakoff : Dunod, 2019 |
Importance : | 272 p. |
Collection : | InfoPro. Management |
ISBN/ISSN/EAN : | 978-2-10-079037-1 |
Langues: | Français |
Thème : |
[Thésaurus BDSP] Information & communication [NI] > Documentation > Traitement documentaire [Thésaurus BDSP] Technologie > Informatique > Informatique appliquée > Intelligence artificielle [Thésaurus BDSP] Technologie > Informatique > Traitement informatique [Thesaurus Rockefeller] ANALYSE DE DONNEE |
Résumé : | Cet ouvrage s'adresse à tous ceux qui cherchent à tirer parti de l'énorme potentiel des technologies Big Data, qu'ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s'est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel de l'exploitation de leurs données clients, fournisseurs, produits, processus, etc. Il a en outre permis l'émergence des techniques d'apprentissage automatique (Machine Learning, Deep Learning...) qui ont relancé le domaine de l'intelligence artificielle. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d'un projet Big Data, en appréhender les concepts sous-jacents et acquérir les compétences nécessaires à la mise en place d'une architecture d'entreprise adaptée. Il combine la présentation : - de notions théoriques (traitement statistique des données, calcul distribué...) ; - des outils les plus répandus ; - d'exemples d'applications, notamment en NLP (Natural Language Processing) ; - d'une organisation typique d'un projet de data science. |
Note de contenu : |
Première partie : les fondements du big data
1. les origines du big data 2. le big data dans les organisations 3. le mouvement NoSQL 4. l'algorithme MapReduce et le framework Hadoop deuxième partie : le métier de datat scientist 5. le quotidien du data scientist 6. exploration et préparation de données 7. le machine learning 8. la visualisation des données troisième partie : les outils du big data 9. l'écosystème Hadoop 10. analyse de logs avec Pig et Hive 11. les architectures λ 12. Apache Storm |
Exemplaires (1)
Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|
658.403./LEM | Livre | Bibliothèque | Bibliothèque | Disponible |