Mathieu VALETTE (in English)
Linguiste
Professeur à l'INaLCO, équipe ERTIM (EA 2520 « Textes, Informatique, Multilinguisme »)
Contact : mvalette@inalco.fr
Principaux thèmes de recherches (et sélection d'articles ad hoc)
Sémantique de corpus, Recherche d'information
Lexiques sémantiques, annotation de corpus (Valette, Estacio-Moreno et al. 2006) (Grzesitchak et al. 2007) (Valette 2008a) (Reutenauer et al. 2009, 2010)
Le cadre général de cette recherche est la constitution d’une ressource lexico-sémantique pour l'annotation fondée sur une conception structuraliste du sens. (Valette 2008a) propose une réflexion sur les lexiques sémantiques généralistes. L’exposé s’articule en deux parties : nous esquissons une analyse critique des ressources lexico-sémantiques existantes en questionnant leur arrière-plan théorique et en tentant de répondre à la question de leurs finalités ; puis, nous présentons le projet de constitution du lexique sémantique dont les présupposés épistémologiques se singularisent par la volonté de prendre en considération les pratiques textuelles d’une part et par le choix des niveaux de description (infralexicaux et textuels, plutôt que lexicaux et propositionnels) d’autre part.
(Valette, Etacio-Moreno et al. 2006) expose une expérience de classification menée sur un corpus de définitions dictionnairiques. L’objectif de l’expérience rapportée est de découvrir des classes sémantiques à partir de définitions dictionnairiques avec la méthode CAH. Les classes sémantiques regroupent des unités lexicales en fonction de sèmes génériques et s’organisent différentiellement en fonction de sèmes spécifiques.
Les applications possibles pour ces recherches sont la recherche d'information et la veille lexicale : (Grzesitchak et al. 2007) présente une expérience d'annotation sémique de quelques textes et l'identification d'isotopies (récurrence de sèmes) dans ces textes. (Reutenauer et al. 2009, 2010) exploitent la ressource lexico-sémantique pour l'étude du changement sémantique en diachronie courte (néosémie, cf. Rastier et Valette 2009).
Classification de textes (Vinot, Grabar & Valette 2003) (Valette & Grabar 2004) (Valette 2004) (Valette & Slodzian 2008)
Il s'agit d'adapter certaines propositions de la linguistique, et plus particulièrement de la sémantique des textes, à la recherche d'information. Dans (Vinot et al. 2003), nous comparons les performances de différents algorithmes de classification sur des pages Web racistes et antiracistes. A partir des limites observées, nous définissons les objectifs d'une classification sur critères linguistiques. (Valette & Grabar 2004) et (Valette 2004) présentent plusieurs aspects d'une plate-forme multilingue de détection de pages Web racistes mettant en jeu une analyse sémantique globale, multicritères, et différentielle des documents. Elle repose à la fois sur les propositions théoriques de la sémantique textuelle et les possibilités offertes par l’implémentation dans un système multi-agents, tout en se démarquant des approches ontologiques classiques.
(Valette & Slodzian 2008) est une synthèse critique des recherches présentées ci-dessus. Après une rétrospective, nous présentons certaines des recherches actuelles menées en Analyse des Données Textuelles (ADT) susceptibles, à plus ou moins court terme, d’améliorer les méthodes de la RI. Ses recherches sont actuellement approfondis dans le cadre du projet ANR C-MANTIC (programme Masse de données et connaissances 2007) qui vise à élaborer des outils logiciels et une méthodologie d’organisation des masses de données documentaires à partir d'une analyse sémiotique et linguistique multi-niveaux prenant en considération l'ensemble des critères textuels et non pas seulement les unités lexicales.
Veille lexicale (Rastier et Valette 2009) (Ollinger et Valette 2010), (Valette 2010c)
(Rastier et Valette 2009) offre une discussion critique sur la polysémie considérée dans une perspective diachronique. On propose de l'opposer à la néosémie. La notion de néosémie invite à considérer l'émergence d'une nouvelle unité lexicale en termes d'économie ou d'organisation sémique : la variabilité des actualisations possibles d'une lexie induit un réaménagement des sèmes composant son signifié. On observe que la néosémie est une reconfiguration du ou des sémèmes constituant la lexie d'origine, notamment par diffusion sémique des contextes et usages dans de nouveaux domaines.
(Ollinger et Valette 2010) présente une plateforme de veille lexicale destinée à l’étude des phénomènes néologiques. Nous détaillons deux de ses modules : un logiciel d’acquisition automatique de candidats à la néologie formelle et catégorielle et une base de données dédiée à l’observation des candidats. Puis, nous exposons notre problématique en nous appuyant sur une étude de cas (corpus de presse). Nous construisons à cette occasion les notions de richesse néologique et de créativité lexicale, en lien avec les genres textuels. On peut utiliser l'outil d'acquisition automatique de candidats à la néologie ici.
Épistémologies (études et instrumentation)
Épistémologie numérique (méthodologie pour l'interprétation des textes scientifiques) (Valette 2003b, 2006bc, 2007)
À partir du moment où l’activité principale des scientifiques est l’écriture, leurs théories peuvent être considérées comme des textes. Notre objectif est de discuter des conséquences de cette affirmation, en élaborant une méthodologie fondée sur la sémantique textuelle et la linguistique de corpus. Les études présentées reposent sur un corpus de 1 600 000 mots fait de conférences, livres et articles écrits par le linguiste français Gustave Guillaume (1883-1960). (Valette 2003b, 2006b) traitent de l’évolution conjointe du lexique et du système conceptuel pendant l’élaboration de la théorie ; des liens entre lexicalisation et conceptualisation à travers les variations morphémiques et la créativité lexicale ; du recours à l’analyse des tropes pour caractériser et définir un concept sans prendre en compte l’objectif du scientifique (concept de mécanisme). (Valette 2006c, 2007b) analyse l'influence de l'intertexte sur la formation des concepts.
Épistémologie des linguistiques énonciatives et cognitives (Valette 2003abc, 2004b, 2006abc, 2007)
[Quatrième de couverture de Valette 2006a] À partir d’un travail de relecture reposant sur un corpus composé d’articles, de conférences, mais aussi de brouillons et de réflexions inédites, Mathieu Valette rend compte de l’effort de problématisation et de théorisation de la relation langue/pensée chez le linguiste Gustave Guillaume (1883-1960). Il reconstruit ses positions et en dégage les aspects novateurs qui ont fécondé jusqu’à nos jours les travaux de linguistique générale portant sur l’énonciation et la cognition. L’auteur évalue et illustre la réception des propositions de Gustave Guillaume par l’étude de trois théories énonciatives et cognitives françaises dont les auteurs appartiennent à la génération suivante : la sémantique énonciative conceptuelle de Bernard Pottier, la neurolinguistique analytique de Maurice Toussaint et la théorie des opérations énonciatives d’Antoine Culioli.
On peut en apprendre davantage sur (Valette 2006a) en consultant les comptes rendus (Lire les comptes rendus). La plupart des autres références sont en ligne ci-dessous.
La plupart des publications sont désormais disponibles sur HAL même lorsque ce n'est pas indiqué ci-dessous.
2011
Eensoo-Ramdani, Egle, Evelyne Bourion, Monique Slodzian, Mathieu Valette (2011) « De la fouille de données à la fabrique de l'opinion. Enjeux épistémologiques et propositions », Analyse d'opinions sur internet, Luc Grivel, éd., Les Cahiers du Numérique, Volume 7, n°2, pp. 15-39.
2010
Mathieu Valette (2010c) « Méthodes pour la veille lexicale », Sur les dictionnaires, Leila Messaoudi, Hafida El Amrani, Brahim El Gouak, Taoufik Akkah Afkinich, dir., Publication du laboratoire Langage et société, Université Ibn Tofail, Kénitra, pp. 251-272. (Prépublication HAL)
Mathieu Valette (2010b), « Propositions pour une lexicologie textuelle », Les configurations du sens, Peter Blumenthal & Salah Mejri, éd., Zeitschrift für Französische Sprache und Literatur, 37, Franz Steiner Verlag, éd., pp. 171-188. (Prépublication HAL)
Coralie Reutenauer, Évelyne Jacquey, Michelle Lecolle, Mathieu Valette (2010) « Sémème au macroscope : genèse et variation sémiques d'une unité lexicale », Actes des 10e Journées d'Analyse des Données Textuelles (JADT 2010), Rome, 9-11 juin 2010, pp. 467-478. (Article)
Mathieu Valette (2010a) « Des textes au concept. Propositions pour une approche textuelle de la conceptualisation », Actes des 21es Journées francophones d’Ingénierie des Connaissances (IC'2010) (8-11 juin 2010), Nîmes Sylvie Despres, éd., Publication de l’Ecole des Mines d’Alès, pp. 5-16. (Article)
Sandrine Ollinger, Mathieu Valette (2010), « La créativité lexicale : des pratiques sociales aux textes », Actes del I Congrés Internacional de Neologia de les llengües romaniques (CINEO’08) (Barcelona, 07-10 maig 2008), M. Teresa Cabré i Castellví, Ona Domènech Bagaria, Rosa Estopà Bagot, Judit Freixa Aymerich, Mercè Lorente Casafont (Ed.), Publicacions de l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra (UPF), pp. 965-876. (Article)
Coralie Reutenauer, Mathieu Valette, Evelyne Jacquey (2010) « De l’annotation sémique globale à l’interprétation locale : environnement et image sémiques d’‹ économie réelle › dans un corpus sur la crise financière », Cognitica – Actes du colloque de l’Association pour la Recherche Cognitive Arco’09 : Interprétation et problématiques du sens (9–11 novembre 2009, Rouen), pp. 29-39. (Actes)
Monique Slodzian, Mathieu Valette, éd. (2010) Du thème au terme. Émergence et lexicalisation des connaissances (TIA'09 Workshop, 20 novembre 2009, Toulouse), CEUR Workshop Proceedings, vol. 579. ISSN : 1613-0073. (Actes)
2009
Mathieu Valette (2009a) « Les multiples dessins de Gustave Guillaume », Les linguistes et leurs graphiques, S. Badir, M. Sassier, éd. Cahiers parisiens/Parisian Notebooks, The University of Chicago, Center in Paris, n°5, Paris, 537-553. ISBN : 978-2-95259-624-4
Mathieu Valette (2009b) « Détection automatique des documents racistes et xénophobes sur Internet. L'apport de la sémantique de corpus », Sciences du langage et demandes sociales, actes du colloque 2007 de l'ASL, textes réunis et présentés par Christian Hudelot et Christine Jacquet-Pfau, Lambert-Lucas, Paris. ISBN : 978-2-35935-018-0
Mathieu Valette (2009c) Approche textuelle du lexique, mémoire pour l'Habilitation à Diriger des Recherches, Institut National des Langues et Civilisations Orientales, Paris. (fac-similé)
Monique Slodzian, Mathieu Valette (2009) « Connaissances prescrites ou connaissances décrites ? Lapport de la sémantique des textes », Patrimoine 3.0, Actes du 12e Colloque International sur le Document Electronique. Organisé du 21 au 23 octobre 2009 à l'Université de Montréal (CIDE.12), Khaldoun Zreik, dir., Europia Productions, Paris, pp. 129-141. (Article)
François Rastier, Mathieu Valette (2009) « De la polysémie à la néosémie », Le français moderne, S. Mejri, éd., La problématique du mot, 77, 97-116. (En ligne sur Texto !)
2008
Mathieu Valette (2008a) « A quoi servent les lexiques sémantiques ? Discussion et proposition », Description linguistique pour le traitement automatique du français, M. Constant, A. Dister, L. Emirkanian & S. Piron, éd., Cahiers du CENTAL, n°5 – décembre 2008, Presses Universitaires de Louvain, 43-58.
Mathieu Valette, éd. (2008b) Textes, documents numériques, corpus. Pour une science des textes instrumentée, Syntaxe & Sémantique, n°9/2008 (Lire le sommaire)
Carine Duteil, Mathieu Valette (2008) « Appropriation et réécriture : l’exploitation des faits divers par les sites Web racistes », Récits et dispositifs du fait divers, Médias & Culture – La revue européenne des pratiques médiatiques et culturelles, n° spécial – novembre 2008, L'Harmattan, Paris, 103-119.
Mathieu Valette, Monique Slodzian (2008) « Sémantique des textes et Recherche d'information », Extraction d'information : l'apport de la linguistique, A. Condamines & Th. Poibeau, éd., Revue Française de Linguistique Appliquée, volume XIII-1 – juin 2008), 119-133. (Pour en savoir plus)
2007
Mathieu Valette (2007) « Remarques sur la genèse du concept d'effection chez Gustave Guillaume », Psychomécanique du langage et linguistiques cognitives (Acte du XIe colloque de l’Association Internationale de Psychomécanique du Langage, Montpellier, 8-10 juin 2006, J. Bres, M. Arabyan, Th. Ponchon, L. Rosier, R. Tremblay & P. Vachon-L'Heureux, éd., Lambert-Lucas, Limoges, 99-108.
Mick Grzesitchak, Evelyne Jacquey, Mathieu Valette (2007) « Systèmes complexes et analyse textuelle : Traits sémantiques et recherche d'isotopies », ARCo’07 – Cognition, Complexité, Collectif., Acta-Cognitica, 227-235. (Article)
2006
Mathieu Valette (2006a) Linguistiques énonciatives et cognitives françaises. Gustave Guillaume, Bernard Pottier, Maurice Toussaint, Antoine Culioli, Collection « Bibliothèque de Grammaire et de Linguistique », Honoré Champion, Paris, ISBN: 2-7453-1549-8. (Pour en savoir plus)
Mathieu Valette (2006b) « La genèse textuelle des concepts scientifiques. Étude sémantique sur l’œuvre du linguiste Gustave Guillaume », Cahiers de Lexicologie, 2/2006, n°89, pp. 125-142. (en ligne sur Texto !)
Mathieu Valette (2006c) « Observations sur la nature et la fonction des emprunts conceptuels en sciences du langage », Corpus en Lettres et Sciences sociales : des documents numériques à l'interprétation, Actes du colloque international d'Albi, juillet 2006. C. Duteil, B. Foulquié (publ.), F. Rastier, M. Ballabriga (dir.), Paris, Texto !, 2006. ISSN 1773-0120 (Article en ligne sur Texto !)
Mathieu Valette, Alexander Estacio-Moreno, Etienne Petitjean, Evelyne Jacquey (2006) « Éléments pour la génération de classes sémantiques à partir de définitions lexicographiques. Pour une approche sémique du sens », Verbum ex machina, Actes de la 13ème conférence sur le traitement automatique des langues naturelles (TALN 06), P. Mertens, C. Fairon, A. Dister, P. Watrin (éds). Cahiers du CENTAL, 2.1, UCL Presses Universitaires de Louvain. Volume 1, pp. 357-366. (en ligne sur Texto !)
Mathieu Valette, François Rastier (2006) « Prévenir le racisme et la xénophobie – propositions de linguistes », Les langues modernes, 2/2006, Enseignez le mal, Pierre Frath, éd., pp. 68-77 (en ligne sur Texto !)
2004
Mathieu Valette (2004a) « Sémantique interprétative appliquée à la détection automatique de documents racistes et xénophobes sur Internet », Approches Sémantiques du Document Numérique, Actes du 7e Colloque International sur le Document Electronique, 22-25 juin 2004, P. Enjalbert et M. Gaio, eds, 2004, pp. 215-230. (en ligne sur Texto !)
Mathieu Valette (2004b) « Actualisation et énonciation : retour sur une gémellité problématique », History of Linguistics in Texts and Concepts — Geschichte der Sprachwissenschaft in Texten und Konzeptionen, actes du colloque éponyme, 15-17 novembre 2001, Potsdam (Allemagne), G. Haßler, G. Volkmann (Eds.), Nodus Publikationen, Münster, 2 vols, pp. 813-821. (Article)
Mathieu Valette, Natalia Grabar (2004) « Caractérisation de textes à contenu idéologique : statistique textuelle ou extraction de syntagme ? l’exemple du projet PRINCIP », Le poids des mots, Actes des 7èmes Journées internationales d’Analyse statistique des Données Textuelles (JADT), 10-12 mars 2004, Louvain-la-Neuve (Belgique), G. Purnelle, C. Fairon, A. Dister, éds., UCL-Presses Universitaires de Louvain, pp. 1106-1116. (Article)
Driss Ablali, Mathieu Valette, éd. (2004) Du continu : son et sens, Cahiers de praxématique, 42/2004. (Avant-propos)
2003
Mathieu Valette (2003a) « Énonciation et cognition : deux termes in absentia pour des notions omniprésentes dans l’œuvre de Guillaume », Le français moderne, tome LXXI, n°1, Jeunesse du guillaumisme, O. Soutet, éd., pp. 6-25. (Article)
Mathieu Valette (2003b) « Conceptualisation and Evolution of Concepts. The example of French Linguist Gustave Guillaume », Academic discourse – multidisciplinary approaches, Kj. Fløttum & F. Rastier, eds., Novus Press, Oslo, pp. 55-74. (Article)
Mathieu Valette (2003c) « Intentionnalité du sujet et téléonomie de la langue dans la linguistique cognitive/énonciative », Parcours énonciatifs et parcours interprétatifs. Théories et applications, Actes du colloque de Tromsø, 26-28 octobre 2000, A. Ouattara, éd., Gap/Paris, Ophrys, pp. 289-301. (Article)
Romain Vinot, Natalia Grabar, Mathieu Valette (2003) : « Application d’algorithmes de classification automatique pour la détection des contenus racistes sur l’Internet », actes du colloque TALN 2003, 11-14 juin 2003, Batz sur Mer, pp. 257-284. (Article)
2002
Mathieu Valette (2002a) « Le langage comme système complexe et auto-organisé chez Gustave Guillaume. Éléments de lecture », Le système des parties du discours. Sémantique et syntaxe. Actes du IXe colloque de l’Association Internationale de Psychomécanique du Langage, R. Lowe, éd., Québec, P.U. de Laval, 536-544.
Mathieu Valette (2002b) « Langage et analyse du psychisme, psychomécanique et inconscient. Freud, Guillaume, Lacan », Le signe et la lettre. Hommage à Michel Arrivé (J. Anis, A. Eskénazi & J.-F. Jeandillou, éd.), Paris, L’Harmattan, coll. « Sémantiques », pp. 441-451.