Pour la mise en place d’algorithmes de reconnaissance sonore, SoL doit établir un corpus d’entraînement. Il s’agit de constituer un corpus facilement mobilisable. La problématique de l’annotation et notamment la réflexion autour d’une interface permettant d’annoter très précisément en temps/fréquences les vocalisations au sein des enregistrements sonores est une question majeure étudiée par ce groupe de travail car elle conditionne le résultat de la reconnaissance automatique.
Ce groupe de travail constitue le corpus, définit une solution optimale pour l’annotation des enregistrements, le type d’apprentissage supervisé ou non supervisé, ainsi que la méthode garantissant la robustesse de l’apprentissage : base d’apprentissage, base d’optimisation, base de test, paramètres à conserver.
Personnes impliquées :
- UMR CESCO Centre d'Écologie et des Sciences de la Conservation : Yves Bas et Grégoire Loïs
- UMR Chrono-Environnement : Jérémy Froidevaux
- UMR ISYEB Institut de Systématique, Evolution, Biodiversité : Tony Robillard, Jérôme Sueur et Sylvain Haupert
- Lab-STICC Laboratoire des sciences et techniques de l'information, de la communication et la connaissance : Nicolas Farrugia
- UMR Passages : Shadia Kilouchi
- UAR PatriNat Patrimoine Naturel : Jacques Comolet et Stanislas Wroza
- Muséum National d'Histoire Naturelle : Frédéric Guilbert