Less is more : vers la simplification des modèles

Keynote machine learning: what works and what they won’t tell you

Ted Dunning, Chief Application Architect, MAPR


Ted Dunning explique que dans les dix prochaines années, une grand nombre de problèmes pourront être résolus aisément grâce au machine learning. C'est ce qu'il nomme le "cheap learning" par opposition aux méthodes plus complexes comme le deep learning. Les gros volumes de données peuvent simplifier les problèmes parce que les structures et tendances émergent d'elles mêmes.

Une première méthode à considérer est l'analyse de cooccurrences. La cooccurrence est la présence simultanée de  plusieurs mots dans un même énoncé. Un exemple d'application est l'étude des différences entre ce que les clients disent, veulent et achètent. Cette méthode peut aussi être utile dans la classification de documents, la parenté entre les langues ou les systèmes de recommandation.

"There are easy machine learning techniques to get good results. The easy stuff often does not make it in academia." - Ted Denning, Chief Application Architecy @MAPR

Une deuxième approche à privilégier est la réutilisation de modèles complexes déjà entrainés. L'idée repose sur l'apprentissage par transfert (transfer learning en anglais) qui vise à transférer les connaissances d'une tâche pour effectuer une autre tâche. Ted Dunning donne l'exemple de la réutilisation du modèle de deep learning Inception mis au point par Google pour faire une tache simple de reconnaissance d'image : distinguer des images contenant des poules contenant de celles qui présentent des hommes. 

En conclusion, on entend peu parler des méthodes de machine learning qui sont simples et efficaces parce qu'elles intéressent moins les chercheurs mais ces méthodes existent.

Ready for the next generation of analytics?

Try HyperCube and experience its unrivaled range of features and ease of use Get started