Infrastructures et recommandations pour les Humanités Numériques

Abstract : Le développement du Web et des réseaux sociaux ou les numérisations massives de documents contribuent à un renouvellement des Sciences Humaines et Sociales, des études des patrimoines littéraires ou culturels, ou encore de la façon dont est exploitée la littérature scientifique en général. Les humanités numériques, qui croisent diverses disciplines avec l’informatique, posent comme centrales les questions du volume des données, de leur diversité, de leur origine, de leur véracité ou de leur représentativité. Les informations sont véhiculées au sein de « documents » textuels (livres, pages Web, tweets...), audio, vidéo ou multimédia. Ils peuvent comporter des illustrations ou des graphiques. Appréhender de telles ressources nécessite le développement d'approches informatiques robustes, capables de passer à l’échelle et adaptées à la nature fondamentalement ambiguë et variée des informations manipulées (langage naturel ou images à interpréter, points de vue multiples…). Si les approches d’apprentissage statistique sont monnaie courante pour des tâches de classification ou d’extraction d’information, elles doivent faire face à des espaces vectoriels creux et de dimension très élevées (plusieurs millions), être en mesure d’exploiter des ressources (par exemple des lexiques ou des thesaurus) et tenir compte ou produire des annotations sémantiques qui devront pouvoir être réutilisées. Pour faire face à ces enjeux, des infrastructures ont été créées telle HumaNum à l’échelle nationale, DARIAH ou CLARIN à l’échelle européenne et des recommandations établies à l’échelle mondiale telle que la TEI (Text Encoding Initiative). Des plateformes au service de l’information scientifique comme l’équipement d’excellence OpenEdition.org sont une autre brique essentielle pour la préservation et l’accès aux « Big Digital Humanities » mais aussi pour favoriser la reproductibilité et la compréhension des expérimentations et des résultats obtenus.
Type de document :
Communication dans un congrès
Journée Big Data PREDON, Nov 2015, Marseille, France
Liste complète des métadonnées

http://hal.in2p3.fr/in2p3-01238662
Contributeur : Danielle Cristofol <>
Soumis le : dimanche 6 décembre 2015 - 17:04:08
Dernière modification le : lundi 29 janvier 2018 - 15:52:03

Identifiants

  • HAL Id : in2p3-01238662, version 1

Collections

Citation

P. Bellot. Infrastructures et recommandations pour les Humanités Numériques. Journée Big Data PREDON, Nov 2015, Marseille, France. 〈in2p3-01238662〉

Partager

Métriques

Consultations de la notice

196