MSE Master of Science in Engineering

The Swiss engineering master's degree


Chaque module vaut 3 ECTS. Vous sélectionnez 10 modules/30 ECTS parmi les catégories suivantes:

  • 12-15 crédits ECTS en Modules technico-scientifiques (TSM)
    Les modules TSM vous transmettent une compétence technique spécifique à votre orientation et complètent les modules de spécialisation décentralisés.
  • 9-12 crédits ECTS en Bases théoriques élargies (FTP)
    Les modules FTP traitent de bases théoriques telles que les mathématiques élevées, la physique, la théorie de l’information, la chimie, etc., vous permettant d’étendre votre profondeur scientifique abstraite et de contribuer à créer le lien important entre l’abstraction et l’application dans le domaine de l’innovation.
  • 6-9 crédits ECTS en Modules contextuels (CM)
    Les modules CM vous transmettent des compétences supplémentaires dans des domaines tels que la gestion des technologies, la gestion d’entreprise, la communication, la gestion de projets, le droit des brevets et des contrats, etc.

Le descriptif de module (download pdf) contient le détail des langues pour chaque module selon les catégories suivantes:

  • leçons
  • documentation
  • examen 
Recherche d'informations et Data Mining (TSM_InfData)

-

Compétences préalables

  • Connaissances dans le domaine de bases de données relationnelles
  • Connaissances de base en statistiques
  • Bonnes bases de programmation orientée objets (Java)

Objectifs d'apprentissage

  • Le cours fournit une introduction au domaine de la recherche d'informations et au domaine multidisciplinaire de data mining.
  • Les étudiants connaissent l'architecture d'un système de recherche d'information.
  • Ils connaissent les modèles de RI (booléen et vectoriel), ainsi que l'utilisation de ces modèles pour déterminer le poids des termes d'indexation et calculer la correspondance entre les documents et les requêtes.
  • Ils comprennent les différentes mesures de l'évaluation d'un système de recherche d'information et sont capables d'appliquer les algorithmes de comparaison et d'interpréter leurs résultats. 
  • Ils connaissent l'utilisation de la librairie Apache Lucene pour l'indexation et la recherche d'information selon le modèle booléen et vectoriel 
  • Ils connaissent les techniques de détection des documents similaires en utilisant les algorithmes de type « Localitiy Sensitive Hashing »
  • Les étudiants comprennent l'utilisation des technologies modernes de bases de données pour le traitement et la gestion de grandes collections de données.
  • Les étudiants reçoivent une introduction au domaine de bases de données multidimensionnelles, aux modèles d’entreposage de données, aux techniques OLAP. Ils connaissent de nouvelles structures de données (types de données) alternatives aux systèmes de gestion de bases de données relationnels (SGBDR) (non relationnelles notamment) et sont capables de déterminer quels types de données et quel système de base de données sont appropriés en fonction du contexte et du genre de données disponibles.
  • Ils connaissent les techniques de pré-traitement des données (le concept de qualité des données et les méthodes de nettoyage des données, d'intégration des données, de réduction des données, de transformation des données et de discrétisation des données).
  • Ils connaissent les principales tâches de data mining et les méthodes principales associées : analyse descriptive de données, analyse du panier d'achats (règles d'association), classification (arbres de décision), clustering (hiérerchique et non hiérarchique), estimation, détection de données aberrantes, etc.
  • Ils sont capables de réutiliser les connaissances acquises durant ce cours dans leur propre environnement de travail et de les appliquer afin de résoudre leurs problèmes spécifiques.

Catégorie de module

Le module s’articule en deux parties, la première est dédiée au domaine de la recherche d'information et la deuxième au domaine de data mining  :

  1. Basic concepts of IR
  2. Boolean retrieval model
  3. Vector space model and efficient ranking
  4. Query refinement
  5. Evaluation of IR systems
  6. The Lucene API for Information Retrieval and evaluation
  7. Near duplicate detection
  8. Introduction to Data Warehousing and OLAP 
  9. Pré-traitement de données
  10. Introduction to Data Mining
  11. Classification
  12. Market basket Analysis
  13. Clustering
  14. Estimation

 

  1. Recherche d'information: 7 semaines
  2. Data mining: 7 semaines

Méthodes d'enseignement et d'apprentissage

Enseignement magistral, exercices, des laboratoires.

Bibliographie

Suggestion de bibliographie optionnelle (ouvrages):

  • Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber, and Jian Pei, 3rd editionMorgan Kaufmann, 2011.
  • DB: Lena Wiese: Advanced Data Management for SQL, NoSQL, Cloud and Distributed Databases. De Gruyter Textbook. 2015. ISBN 978-3-11-044140-6.
  • IR: "Modern Information Retrieval". (Recherche d’information moderne) Baeza-Yates & Ribeiro-Neto, New York (2011). ISBN: 9780321416919.
  • IR: Introduction to Information Retrieval. C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2008. Classical and web information retrieval systems: algorithms, mathematical foundations and practical issues.
  • IR: Information Retrieval in Practice. B. Croft, D. Metzler, T. Strohman. Pearson Education, 2009.

Télécharger le descriptif complet

Retour