Association des

industries de la langue

du Pays Basque

Vous êtes ici :
Actions sur le document

RSS

23/06/2013 PRISM: Orwell en a rêvé, les US l'ont fait
23/01/2013 Podcast: Qu'est-ce que le traitement automatique des langues ?
Vous me lisez beaucoup (enfin, moins ces temps-ci, mea culpa !), mais si vous voulez aussi entendre ma superbe voix, voici un podcast d'une interview réalisée il y a quelques jours pour Science alors ! , l'émission scientifique de Radio Campus Clermont : L'émission s'appelait L'homme et la machine, avec pour invités Bertrand Nouailles, philosophe, et Hélène Chanal, enseignante-chercheuse en robotique de production à l'IFMA.
16/01/2013 e-Reputation: Droit à l'oubli et autres réflexions
Marie Jung de 01 Business & Technologies m'a demandé ce que je pensais de l'e-reputation, les questions de droit à l'oubli, les logiciels de veille, etc. L'interview est dans la version papier, et aussi sur le site de 01net : Une page c'est déjà pas mal, mais j'ai l'impression qu'on n'a fait qu'effleurer la surface, tellement il y aurait de choses à dire !
06/12/2012 Expertises vocales: Lettre à Jérôme Cahuzac
Monsieur le Ministre, Je me permets de vous faire parvenir cette information qui peut vous être utile dans les circonstances actuelles. La plupart des chercheurs en technologies du langage considèrent que les expertises vocales manquent totalement de fiabilité en l'état actuel de la technique, et qu'elles peuvent difficilement aboutir à l'identification des individus — a fortiori quand les enregistrements sont de mauvaise qualité.
19/10/2012 Conf: Big Data et Technologies du Langage
Je fais une présentation demain matin dans le cadre des Assises du Big Data, du Stockage et des Bases de données organisée pas le CRIP . Pour ceux que cela intéresse et qui ne pourraient pas y être (et même pour les autres), voici un petit résumé : Big data et technologies du langage Jean Véronis Les données massivement accumulées par des sociétés comme Google ont permis des avancées considérables dans le ...
10/10/2012 Trendsboard: L'app mobile #PepsiBuzz est sortie
Comment créer un magazine automatique sur smartphone qui fasse remonter le meilleur (ou le pire ;-) des buzz pour les ados (13-17 ans) sur des sujets déterminés (musique, sports, LOL, ciné, people) ? Et en plus, comment mélanger de façon pertinente les news (médias, blogs), les tweets des célébrités, les vidéos Youtube ? Lorsque Pepsi a confié cette mission à Trendsboard , la plateforme que nous avons imaginée avec Benoît Raphaël il ...
03/10/2012 Trendsboard: Analyse d'un buzz cochon
Lorsque j'ai écrit mon billet sur le fermier qui se fait manger par ses cochons ( hier ), j'ai eu le sentiment qu'il contenait tous les ingrédients pour un bon buzz en France. Insolite, décalé, un peu gore, les internautes (et donc les médias) adorent. Je ne m'étais pas trompé.
03/10/2012 Trendsboard: Analyse du buzz #geonpi
Vous avez sans doute croisé ce mouvement né dimanche, qui s'est autobaptisé Les Pigeons: mouvement de défense des entrepreneurs français. Un hashtag sur Twitter ( #geonpi ) avec plus de 6100 tweets au moment où j'écris, une page Facebook avec plus de 24 000 likes, des articles dans tous les grands quotidiens...
02/10/2012 Trendsboard: La version US c'est parti !
Grande excitation chez Trendsboard ce matin. Un nouveau bébé est né...! La version US commence à tourner. Déjà plusieurs milliers de sources, et les buzz commencent à arriver sur nos écrans. On peut dire que c'est une version 0.0.0.1 : il y a encore énormément de travail, mais d'ores et déjà, je sens que c'est un outil qui va devenir le compagnon indispensable des salles de rédac.
19/09/2012 Twitter: Analyse du buzz Charlie Hebdo
Je suis l'évolution de l'affaire des caricatures de Charlie Hebdo sur Twitter depuis hier après-midi, grâce à la plateforme Trendsboard que nous sommes en train de lancer avec mon ami Benoit Raphaël , et j'ai envie de vous livrer quelques observations... Le buzz a commencé sur Twitter en début d'après midi, avant la publication des premiers articles de presse quelques heures après, et c'est seulement dans la soirée que Google News a ...
08/07/2012 Ayrault: Un discours sans surprise
[Tribune publiée sur lexpress.fr ] Pas de lyrisme dans le discours de politique générale de Jean-Marc Ayrault ( voir le discours sur ma base des discours de politique générale de la Ve République). Le personnage ne nous a pas habitués aux grands élans d'enthousiasme et de grandiloquence, et il a été égal à lui-même: sérieux, sobre, technique.
03/07/2012 Outil: Un demi-siècle de discours de politique générale
France Culture a eu la gentillesse de m'interroger sur les discours de politique générale des Premiers ministres sous la Vè République, pour l'émission Le choix de la rédaction ( écouter podcast ). Je me suis replongé à cette occasion dans l'intégralité des discours, que j'avais mise en ligne en 2007 avec un moteur permettant de chercher des mots et des expressions, des outils statistiques simples, et une visualisation sous forme de nuages ...
23/05/2012 Législatives: Carte de France de la (non)-parité
Je me suis amusé à analyser la liste des 6611 candidats aux législatives diffusée par le ministère de l'Intérieur. On a largement dit dans la presse que 2646 de ces candidats sont des candidates, soit 40,0%. En comptabilisant les civilités, M. ou Mme, j'ai réalisé une carte de la parité par département (cliquer pour agrandir) : Douze départements sont particulièrement vertueux et atteignent ou dépassent la parité, la palme revenant à l'Ariège, ...
23/05/2012 Législatives: Philippe et Catherine, les prénoms des candidats
J'ai publié hier la carte de la non-parité dans les candidatures pour les législatives. Voici aujourd'hui une étude des prénoms des candidats. Les grands gagnants sont Philippe et Catherine : Ces prénoms nous disent des choses. En croisant avec les données de l'INSEE, on voit que Philippe et Catherine ont eu leur pic de popularité en 1963.
22/05/2012 Appli: France 2012 - Législatives
Vous avez peut-être téléchargé l'application France 2012 pour iPad et smartphones, que nous avons réalisée pour Radio France et l'AFP avec mes amis Benoît Raphaël , le graphiste Julien Tauvel et l'équipe Revsquare à New York (Benoît l'avait décrite ici ). Attention, Véronis inside® ;-) Ce sont mes algorithmes qui sont à l'oeuvre pour tout le "backoffice", c'est-à-dire la détection des termes et entités nommées (personnes, lieux, partis et autres), le "clustering" ...
05/05/2012 Présidentielle: La présence des candidats sur le Web entre les deux tours
Juste avant le premier tour, j'avais montré ( ici ), grâce à ma plate forme qui analyse en temps réel plusieurs milliers de sources (médias et blogs), que les volumes de citations sur le Web reflétaient d'assez près les mouvements d'opinion. Il faut bien sûr prendre tout cela avec prudence, car nous manquons d'études et de recul, mais on y voyait en particulier juste avant le premier tour, les trois tendances que ...
04/05/2012 Débat: Moi, François Hollande
Tous les commentateurs ont relevé la tirade finale de François Hollande lors du débat qui l'opposait à Nicolas Sarkozy : Moi, président de la République... Répétée 15 fois. Une belle anaphore, figure chère à la plume de Nicolas Sarkozy, Henri Guaino, dont elle a été en quelque sorte la marque de fabrique en 2007 (voir étude ici et ici ).
02/05/2012 Google: Fichier juif ?
Avant-hier, TF1 a perturbé ma sieste dominicale en m'envoyant une équipe pour recueillir quelques mots pour le JT de 20h sur l'affaire du « fichier juif » de Google... Une séquence de fin de JT n'est pas un format qui se prête beaucoup à l'élaboration, et je me suis dit que je pourrais essayer de rassembler ici mes réfléxions sur le sujet.
23/04/2012 Présidentielle: Le Web a fait mieux que les sondeurs
Je constatais vendredi le tassement de Mélenchon dans les volumes de news, la percée de François Hollande et celle de Marine Le Pen, et je concluais par une double question : "Alors, vague rose ? vague bleu marine ? Nous verrons bien dimanche". Nous avons vu.
21/04/2012 Présidentielle: La présence des candidats sur le Web
A la veille de la trêve pré-électorale, je crois que c'est le moment de publier quelques données extraites de ma plateforme d'observation qui analyse quotidiennement plusieurs milliers de sources d'actualité sur le Web. Je ne sais d'ailleurs pas si demain cela ne pourrait pas être considéré comme un sondage (et je n'ai pas 75000 euros de côté pour le cas où !)...