Meta annonce l’ouverture gratuite permettant l’accès à son modèle de traitement de langage
Meta a annoncé le 3 mai 2022, dans un poste de blog, partager son Open Pretrained Transformer (OPT-175B). Ce dernier est un modèle de traitement de langage pour la recherche en intelligence artificielle (IA) comprenant 175 milliards de paramètres figurant dans des données accessibles au public plus connu sous le nom d’open source. Il pourra être utilisé à des fins non commerciales.
Ce modèle OPT- 175B dispose de capacités similaires à celui créé par l’OpenAI, entreprise cofondée par Elon Musk. Selon Joelle Pineau, co-directrice générale d’AI Research, OPT- 175B a été copié intentionnellement sur GPT-3 dans le but que le niveau de précision des tâches linguistiques dont ce dernier est doté corresponde à ce nouveau modèle.
Une décision favorisant la compréhensibilité et transparence du fonctionnement des modèles
Contrairement à l’OpenAI, dont l’accessibilité à son API était payante, Meta souhaite rendre son code open source afin d’inciter les chercheurs, universitaires et laboratoires de recherches du monde entier à collaborer avec eux afin d’améliorer son modèle de traitement de langage. Meta a justifié sa volonté de partage par les termes suivants : « Pour maintenir l’intégrité et prévenir les abus, nous publions notre modèle sous une licence non commerciale pour nous concentrer sur les cas d’usage de la recherche ». Toutefois, pour en profiter, ils doivent être dotés de données suffisantes. Par conséquent, le fonctionnement de ces modèles de traitement de langage n’est pas intelligible par tous.
Toutefois, l’objectif est de parvenir à une technologie plus transparente. Pourtant, telle n’était pas la volonté de Meta auparavant qui avait plutôt tendance à déguiser ses erreurs. Récemment, l’entreprise Meta a publié l’entièreté du code du modèle ainsi qu’un cahier de bord permettant de documenter le processus d’entraînement de l’intelligence artificielle. Par conséquent, trois mois de recherche ont été dévoilés en répertoriant tous les bugs, crashs et reboots rencontrés.
La construction d’un modèle de langage se fonde à partir de séquence de mots dans une langue naturelle. Le but d’un tel modèle fondé sur le Machine Learning est, par exemple, de prédire à partir de certaines séquences de mots celui ou ceux qui vont suivre grâce aux textes divers et variés dont ils sont dotés.
De cette manière, il est possible pour les particuliers d’interagir avec ces modèles, notamment à travers des chatbots, ou même être confrontés à des décisions qui s’appuient sur ces modèles.
L’un des prochains objectifs pour perfectionner la robustesse de ces algorithmes concernant ces modèles de traitement de langage naturel est d’atténuer les problèmes liés aux préjugés fondés sur la couleur de peau, du sexe ou encore de la religion.
Anissa CHEIKH-BRAHIM
Sources :
https://trustmyscience.com/intelligence-artificielle-meta-modele-langage-libre-acces/
La Déclaration pour l’avenir de l’Internet : affirmation politique d’une volonté (presque) mondiale de régulation du cyberespace
Le 28 avril 2022 était présentée la Déclaration pour l’avenir de l’Internet (Declaration for the Futur of the Internet) lors d’une manifestation organisée à Washington par le Conseil de sécurité nationale de la Maison Blanche. Ce jour marque la convergence de 60 états vers un certain nombre de principes visant à appréhender les risques et enjeux du cyberespace.
Cette déclaration, approuvée par les 27 États membres de l’Union européenne, les Etats-Unis, ainsi que 32 autres États, est symbolique. Les mots de la Présidente de la Commission européenne, Ursula von der Leyen (2019-2024), en témoignent :
« Plus que jamais dans l’histoire de l’humanité, l’internet rapproche les individus. Aujourd’hui, pour la première fois, des pays du monde entier, attachés aux mêmes principes, définissent une vision commune de l’avenir de l’internet, afin d’assurer que les valeurs que nous défendons hors ligne seront également protégées en ligne, de faire de l’internet un lieu sûr et un espace digne de confiance pour tous et de veiller à ce que l’internet serve notre liberté individuelle. Parce que l’avenir de l’internet est également celui de la démocratie, celui de l’humanité ».
Afin de mettre en œuvre cette vision du cyberespace, la Déclaration énonce l’ambition d’un Internet « ouvert, global, interopérable, fiable et sécurisé ». Cette philosophie, partagée par les signataires, se manifeste par cinq principes.
Le premier objectif énoncé dans la déclaration est de garantir la protection des droits et libertés des individus dans le cyberespace. Cela peut se traduire par de la prévention en ligne, la garantie d’un juste équilibre entre la liberté d’expression et le contrôle des contenus en ligne, l’engagement des autorités nationales de garantir les libertés de façon effective, ou encore par la lutte contre les algorithmes portant atteinte aux individus tel que le social scoring. Le deuxième objectif est d’avoir un Internet global en garantissant que l’accès aux contenus en ligne ne soit pas restreint ni contrôlé par le gouvernement et en faisant la promotion des avantages du partage des données entre États. Le troisième objectif poursuivi par les signataires de la Déclaration est de garantir, sans discrimination, un accès à Internet. Le quatrième objectif est de renforcer la confiance dans l’environnement numérique. Cela passe notamment par le renfort de la lutte contre la cybercriminalité ainsi que la protection des données des individus. Enfin, le dernier objectif vise à soutenir le système de gouvernance interétatique (Nations Unis, G7…).
Cette Déclaration, aux objectifs attrayants, est purement politique. Les États signataires ne sont pas liés juridiquement à son contenu. Il s’agit d’un symbole, de l’expression d’une volonté partagée. Une volonté partagée certes, mais ignorée de certaines puissances mondiales. En effet, il n’est pas étonnant de voir des États comme la Chine et la Russie absents de la liste des signataires.
La Déclaration pour l’avenir de l’internet, bien loin de la vision excluant toute intervention étatique dans le cyberespace qu’exprime John Perry Barlow dans sa Déclaration d’indépendance du cyberespace (8 février 1996), mérite d’être saluée bien qu’il ne s’agisse que d’une déclaration symbolique.
Diane MALBOIS
Sources :
https://ec.europa.eu/commission/presscorner/detail/fr/IP_22_2695
https://www.cairn.info/libres-enfants-du-savoir-numerique–9782841620432-page-47.htmâ€
La censure chinoise frappe une nouvelle fois
À l’heure où Elon Musk promet un retour, sans limite, de la liberté d’expression sur Twitter, se pensant au-dessus des lois, il en est différemment en Chine. La plateforme Weibo, équivalente à Twitter, a annoncé, le jeudi 28 avril, à ses utilisateurs que leur adresse IP, et donc leur localisation, seront rendues publiques depuis la page de leur profil et dans leurs commentaires. Cette décision a été justifiée par la direction de Weibo à travers une politique de « lutte contre les mauvais comportements en ligne ».
Quel impact pour la vie privée des utilisateurs ?
Concrètement, les utilisateurs situés en Chine verront leur province ou leur municipalité être affichée ; tandis que ceux situés à l’étranger verront le pays de l’adresse IP être affiché. Finalement, ces paramètres ont pour but de « réduire les mauvais comportements tels que l’usurpation d’identité, la désinformation malveillante et à garantir l’authenticité et la transparence du contenu diffusé », selon Weibo. Cependant, de telles pratiques remettent considérablement en cause la vie privée des utilisateurs, puisque ces derniers voient leurs localisations partagées sans leur consentement. De surcroît, cette « fonctionnalité » est activée pour tous les utilisateurs sans qu’il soit possible de la désactiver.
Par ailleurs, la liberté d’expression est fortement impactée pour les utilisateurs qui craignent nécessairement les répercussions des autorités chinoises. Le recours aux outils de VPN devrait augmenter encore plus drastiquement.
Le gouvernement chinois encore à la manœuvre…
Tout porte à croire que la plateforme Weibo se plie aux directives de Pékin. Certes, le réseau social a précisé que « Weibo s’est toujours engagé à maintenir une atmosphère de discussion saine et ordonnée et à protéger les droits et les intérêts des utilisateurs à obtenir rapidement des informations vérifiées ». Mais en réalité, la Chine est à la manœuvre dans l’objectif, une fois de plus, de contrôler l’internet chinois. Et gare aux récalcitrants, parce que les plateformes chinoises qui ne censurent pas les contenus « critiques » risquent des sanctions financières. À ce titre, le réseau social chinois Weibo a reçu de nombreuses amendes en 2021 pour un montant total de plus de 14 millions de yuans. Parfois, les sanctions sont encore plus lourdes, en ce qu’elles peuvent déboucher sur des suspensions temporaires de service. Autant dire que Weibo ne souhaite pas en arriver à ce stade.
Il semble désormais que Weibo souhaite se conformer aux volontés de Pékin en matière de désinformation à propos de la pandémie et de la guerre russo-ukrainienne. À ce propos, les effets des nouvelles règles étaient déjà visibles sous la publication du réseau social. Effectivement, des milliers de commentaires d’utilisateurs étaient accompagnés d’une étiquette précisant la province ou la municipalité de l’adresse IP de l’utilisateur.
Il s’agit là d’un tour de force supplémentaire par la censure chinoise. Récemment, le journal le Monde rapporté que : « La Chine n’aime pas les oiseaux de malheur, ni le franc-parler de ses économistes » suite à la censure des profils WeChat et Weibo de Hao Hong considérés comme l’un des analystes chinois les plus réputés.
Anthony THOREL
Sources :
https://www.reuters.com/world/china/weibo-shows-user-locations-combat-bad-behaviour-2022-04-28/
https://siecledigital.fr/2021/12/16/chine-weibo-encore-mis-a-lamende/
https://www.theregister.com/2022/04/29/weibo_location_services_default/
Open data des décisions de justice : Mise en ligne des décisions des cours d’appel
Depuis le 30 avril, les décisions rendues par les cours d’appels civiles, sociales et commerciales sont accessibles en ligne sur la plateforme Judilibre. Toutes les décisions rendues après le 15 avril 2022 y sont et y seront téléversées en addition de 80 000 décisions rendues antérieurement.
La loi du 7 octobre 2016 pour une République numérique a été le démarrage d’une politique majeure d’« open data » des données publiques pour le gouvernement français. En accord avec celle-ci, l’Etat français doit par défaut publier les données publiques et d’intérêt général et notamment tous les documents administratifs finalisés et les codes sources des logiciels utilisés pour l’administration des services publics. Elle crée ainsi un véritable service public de la donnée.
L’une des conséquences les plus attendues et les plus discutées de l’open data est la mise en ligne des décisions des juridictions. La perspective de mise à disposition de ces décisions a ainsi motivé le développement d’un secteur privé d’importance, les LegalTechs. En fournissant des volumes importants de décisions à des algorithmes d’apprentissage automatique, il est possible de créer des outils d’analyse de celles-ci qui viendraient profondément modifier l’administration de la justice et la profession d’avocat. Par exemple, Case Law Analytics et Prédictice ont déjà créé des algorithmes permettant de quantifier les risques liés à l’introduction d’une action et la dernière des deux utilise aussi des procédés d’intelligence artificielle pour mettre en place des moteurs de recherche jurisprudentielle.
Ce secteur répond à des dynamiques contemporaines de dématérialisation du droit et de renouvellement de la méthodologie juridique et a de beaux jours devant lui. Déjà au Canada, des avocats ont vu leur responsabilité engagée pour ne s’être pas référés à de tels outils dans leur préparation d’une instance. La généralisation de l’utilisation des opportunités offertes par les LegalTechs n’est donc pas qu’un rêve et la mise en ligne progressive des décisions de justice rythme celle-ci.
Si l’application de la politique de l’open data aux décisions de justice n’a pas été mis en place de façon immédiate après la publication de la loi « Lemaire », elle semble aujourd’hui bien partie. En effet, après que le décret n° 2020-797 du 29 juin 2020 ait désigné la Cour de cassation comme responsable de la publication des décisions de l’ordre judiciaire, celle-ci a développé un logiciel permettant leur pseudonymisation, première étape primordiale à leur publication, les décisions ne devant pouvoir constituer des données à caractère personnel. L’arrêté du 28 avril 2021 pris en application de ce décret a ainsi mis en place un calendrier d’ouverture de ces données imposant la publication de l’ensemble des décisions rendues d’ici à 2025.
Des premières étapes avaient déjà été franchies le 30 septembre 2021 avec la publication des décisions rendues par la Cour de cassation et le Conseil d’Etat et le 31 mars 2022 avec la publication de celles rendues par les Cour administrative d’appel. Les cours civiles, sociales et commerciales d’appel ont ainsi suivi le mouvement le 30 avril dernier. Cette étape en est une d’ampleur car les cours d’appel concernées rendent près de 180 000 décisions par an. La prochaine sera la publication des décisions des tribunaux de commerce prévue pour le 30 juin 2023.
Jean SOUQUET-BASIEGE
Sources :
https://www.20minutes.fr/justice/3280455-20220429-accessibilite-justice-decisions-cours-appel-desormais-acces-libre-internet?fbclid=IwAR1kOwzTxKpLvWIFkRJXdoXUe3GWhI4sgkUNJiaLS2LqHAzIJ6S6vcPbkXE
https://www.gouvernement.fr/action/l-ouverture-des-donnees-publiques
https://www.village-justice.com/articles/open-data-des-decisions-justice-enfin-decret-tant-attendu,35962.html
https://www.courdecassation.fr/la-cour-de-cassation/demain/lopen-data-des-decisions-judiciaires