Professeur responsable

Daniel Lemire

Préalable

INF 1220

Objectifs

Décrire ce qu'est l'information non structurée et le rôle qu'elle joue dans l'organisation. Utiliser les techniques classiques de recherche d'informations (expressions régulières, recherche par mots-clés, etc.) et les techniques Web (algorithmes topologiques tels que PageRank et HUBS, filtrage collaboratif) dans le cadre du développement logiciel et d'activités scientifiques. Évaluer les différentes méthodes de recherche d'informations dans un contexte de gestion des connaissances (index, expressions régulières, modèles booléens, vectoriels et probabilistes, filtrage collaboratif, etc.).

Contenu

Les lois de Zipf et Mandelbrot. Théorie de l'information de Shannon. Formats des métadonnées, XML. Expressions régulières : ancrages, groupement atomique, tests avant/arrière, quantificateurs avides, paresseux et possessifs. Index inversés. Arbres de suffixes. Tableaux de suffixes. Modèles booléens, vectoriels et probabilistes. Modèles de la langue. Ergonomie en recherche d'informations. Hyperonymie, hyponymie, troncature, lemmatisation et thésaurus. Utilisation pratique d'un moteur de recherche dans une application avec Lucene et Snowball. Hyperliens et moteurs de recherche sur le Web : PageRank et HITS. Logistique d'un moteur de recherche Web. Systèmes de recommandation et filtrage collaboratif. Évaluation : précision, rappel, note F, validation croisée.

Matériel didactique

Le matériel didactique est accessible sur le site Web du cours.

Matériel expédié

Renseignements technologiques

Consultez l'information sur le matériel informatique recommandé.

Encadrement

L'encadrement est individualisé et assuré par une personne tutrice. Les communications se font principalement dans les forums de discussion et par courrier électronique.

Évaluation

L'évaluation repose sur six travaux (5 %, 10 %, 10 %, 10 %, 10 % et 5 %) et un examen à domicile (50 %).

Échelle de conversion

NotationValeur numériqueValeur en pourcentage
A+4,396 à 100 %
A492 à 95 %
A-3,788 à 91 %
B+3,384 à 87 %
B380 à 83 %
B-2,776 à 79 %
C+2,372 à 75 %
C268 à 71 %
C-1,764 à 67 %
D+1,360 à 63 %
D150 à 59 %
E00 à 49 %

* Échelle de conversion actuellement en vigueur pour ce cours.

Particularités d'inscription

La connaissance de l'algèbre linéaire de niveau collégial est requise.