Quand la lutte anti-plagiat tourne à la tarte à la crème

Nous avons l’habitude, comme beaucoup de laboratoires, de demander à nos étudiants en thèse d’écrire en guise d’introduction une revue de la littérature. L’intérêt est d’éviter l’introduction de 150 pages et de la focaliser sur le thème du travail. Notre étudiant qui va bientôt passer sa thèse a fait ça. Nous essayons d’éviter le copié-collé d’autres articles. J’ai déjà été victime d’un plagiat grossier, j’y suis assez sensible. Quand on écrit une revue de la littérature, il est fréquent que certaines expression reviennent. Quand vous donnez la définition de la maladie rénale chronique en citant une référence, il y a des chances pour ne pas dire une certitude que ce soit équivalent à ce qui a déjà été utilisé, même choses quand vous dites qu’il y a trois sortes de toxines urémiques, pas beaucoup de changement dans la structure de la phrase, ce sera superposable à ce qui a déjà été écrit. Je précise qu’il y a  systématiquement la référence d’où vient la phrase, on appelle ça citer.

Notre étudiant a écrit, nous avons corrigé avec l’ingénieur qui l’a beaucoup encadré et l’article a été soumis à une revue qui nous avait demandé une revue. Nous étions assez tranquille. Au bout d’une semaine retour de l’éditeur qui nous annonce que notre article est refusé car 34% de notre manuscrit peut être trouvé dans la littérature est que la limite est de 15%. Voici ce qui nous a été envoyé.

« We have downloaded your manuscript into iThenticate, and 34% of your manuscript can be found in previous publications. Your manuscript is being rejected because journal requires that similarity scores do not exceed 15%. »

Nous avons demandez les résultats de l’analyse nous savions que nous n’avions pas copié 30% de l’article à partir d’un article précédent ou plusieurs articles précédent. L’éditeur nous l’a gentiment envoyé. Une belle surprise nous attendait.

Premièrement le document de référence pour la détection du plagiat est soit des sites d’éditeurs, soit des articles, un exemple du rendu:

Je trouve très étonnant de mettre au même niveau des articles et des données trouvées sur le web quand bien même sur le site des éditeurs. Notre étonnement n’allait pas s’arrêter ici. Prenons la référence 5 que nous aurions plagié pour 37 mots, il s’agit d’un papier que nous avons publié cette année. Les 8 premiers mots sont:

Et oui, vous voyez bien, c’est l’adresse du service hospitalier, vous m’accorderez qu’il est difficile de mettre une autre adresse que la notre. Retrouvons les 29 mots suivants:

Nous citons notre travail, c’est le 68 à la fin de la première phrase, le numéro de la référence. De façon peu surprenante, nous reprenons des mots voir des blocs de mots de notre article. 28 mots sur un article qui en contient plus de 3000. Ce ne sont même pas des phrases mais des fragments de phrases. Comment voulez vous ne pas reprendre « that cardiovascular events ». On ne peut pas utiliser « In »? C’est totalement absurde, mais le pire est à venir. Pour la source 2, 42 mots plagiés, je me demandais d’où ceci venait. Il a fallu aller à la fin de l’article.

Oui nous touchons le fond, il s’agit de la déclaration de conflit d’intérêt et de financement. Le truc qui est toujours le même. Tout le monde écrit toujours la même chose. Je finis avec un dernier petit exemple.

Vous voyez ici la source 1 qui est si je comprends bien ce que nous avons le plus plagié, 93 mots sur un site internet qui doit en contenir je ne sais combien. Les mots sont répartis dans tout notre manuscrit par bloc, comme ici de 6 à 9 mots. J’aimerai savoir comment « the transcription factor aryl hydrocarbon receptor (AHR) » peut être écrit autrement. Vous remarquerez un « of » , des « the » surlignés seuls au milieu d’une phrase. Sur 67 sources, 30 sont reconnus pour 10 ou moins de 10 mots…

Je suis juste étonné que notre article en entier ne soit pas reconnu comme un immense plagiat. Il est certain que des séquences de mots ont déjà été utilisés ailleurs, surtout quand vous parlez d’un domaine particulier. Tout devient plagiat, l’utilisation même du langage est alors un plagiat. Du moment où un texte a du sens et suis une syntaxe, des mots, des fragments de phrases seront retrouvés identiques. Est ce du plagiat? Si oui, je me répète, plagie?, tout est plagiat. Je ne peux m’empêcher de penser à la bibliothèque de Babel de Borges, ici point de plagiat car aucun sens, quoi que, comme le veut le paradoxe du singe savant, cet animal qui tape au hasard sur un ordinateur, si on lui en laisse suffisamment de temps pourra probablement écrire notre article. S’agit il alors d’un plagiat?

Je suis convaincu qu’il est important de lutter contre le plagiat. Quand je vois le résultat de l’utilisation du logiciel sur mon travail, je suis surpris pour ne pas dire outré. Si mon adresse ou la déclaration de conflit d’intérêt est du plagiat où est ce que ça commence où est ce que ça finit? Cette utilisation du logiciel est ridicule pour ne pas dire complétement dépourvu de sens. Si tout le monde utilise ce genre d’outils de cette façon je ne suis pas surpris qu’on annonce un tel volume de plagiats. Sincèrement, je ne croirais plus les résultats fournis par des analyses type big data comme on me l’a rendu. A vouloir nettoyer plus blanc que blanc on s’expose à l’effet inverse ou à des utilisations pervers du système. Je vais demander à mon université l’accès à ce genre d’outils pour ne plus avoir la mésaventure que je viens de vivre. Il est très désagréable de se voir copier mais il est aussi très désagréable de se voir accuser de copiage. Ce qui est certain, c’est que nous ne soumettrons plus rien à ce journal.

Pour me remettre de cette histoire, je vous propose un peu de musique, un morceau extrait du dernier album de Nik Bärtsch’s Ronin: Awase. C’est très bon, j’ai découvert ce pianiste suisse par hasard, sa musique est hypnotique et passionnante, peut être que certains y verront du plagiat.

Module 36
Ce contenu a été publié dans Medecine, Médecine humeur, Néphrologie, Science, avec comme mot(s)-clé(s) , , , . Vous pouvez le mettre en favoris avec ce permalien.

12 réponses à Quand la lutte anti-plagiat tourne à la tarte à la crème

  1. Ping : Quand la lutte anti-plagiat tourne à la tarte à la crème – Portail-Veille

  2. b2c dit :

    Merci pour ce moment !

  3. Christine dit :

    Avez-vous fait une réponse argumentée au journal, par principe?

    • PUautomne dit :

      Non, ça ne sert à rien, juste à se faire plaisir. Je préfère passer du temps à soumettre ailleurs.

      • Yann dit :

        Et pas non plus de contact au rédacteur en chef, pour améliorer les pratiques du journal qui sont peut être ici le zèle comptable d’un unique éditeur?
        Rude d’avoir ce type de commentaire et que l’utilisation des logiciels soit dévoyée, comme la bibliométrie peut l’être pour juger du travail d’in chercheur..

  4. Daoud-El Baba dit :

    merci pour cette mise au point !

  5. yal dit :

    Je suis surpris que vous soyez étonné! Vous pensiez que l’intelligence artificielle à ce niveau était plus intelligente que cela? Il faut tout lui dire une fois pour qu’elle s’en souvienne, du grand bleuf ! écrire des requêtes valides n’est pas si simple que cela… je me souviens du début du vidal électronique, ils avaient un moteur de recherche…. j’arrivais, par exemple à sortir une liste de médicaments à la fois non contre-indiqués et à la fois contre-indiqués lors de la grossesse (oui oui, vous avez bien lu)… je leur ai tellement sorti d’anomalies de ce type, (comme c’était sur un forum, ça ne leur plaisaient pas) leur solution a été de supprimer ce moteur de recherche !!! alors que mes test leur a permis de corriger des centaines d’erreurs dans leur base!! il a fallu m’y prendre autrement pour continuer…

  6. Moore dit :

    Il est important de répondre au redacteur du journal, il arrive qu’ils comprennent…
    Il faudrait aussi envoyer cette chronique à hervé maisonneuve qui fait un blog régulier sur les dérives de la litérature médicale

  7. Hélène dit :

    Ce que ça reflète, c’est la crise du reviewing des articles scientifiques, il me semble : trop d’articles, pas assez de temps pour les chercheurs à qui on demande de les relire -> avoir recours à des algorithmes pour filtrer afin de ramener la charge de travail à un volume gérable, sans les valider.

    C’est idiot.

  8. Bonjour,

    ils ne savent pas utiliser iThenticate car ils confondent similitudes et plagiat. pour l’analyse, des parties, telles que les méthodes par exemple, doivent être exclus du champ d’analyse, et bien sûr les affiliations, etc…. Le tableau montré, avec notamment mdpi, n’est pas crédible. Ceci détecte des similitudes, confondues avec du plagiat.
    Pour plagiat, il faut un examen visuel et une comparaison des parties similaires pour s’assurer qu’il n’y a pas citation (ce n’est plus du plagiat), et bien d’autres points.

    Le revue concernée ne sait pas faire !!!!

    Cdlmt

    • PUautomne dit :

      En tout cas ils l’utilisent et ceci pose problème. Je vous assure.
      Il faudrait que les éditeurs fassent autant preuves de professionnalisme que ce qui est exigé des auteurs.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.