La reconnaissance de l'auteur sera utile si vous craignez la malhonnêteté : par exemple, si vous pensez que Shakespeare n'a pas eu assez d'éducation pour écrire des pièces, ou que Jane Eyre de Charlotte Brontë a en fait été écrite par sa sœur Bramwell. Ces outils viendront également à votre aide dans des situations où l'auteur est inconnu et que vous souhaitez citer ou savoir qui blâmer, comme les romans napolitains de "Elena Ferrante". Dans l'exemple que je discute ci-dessous, le poète-philosophe-critique romantique Samuel Taylor Coleridge a Christabel en 1816 ; Kubla Khan, une vision ; Il avait envie de savoir qui avait giflé son volume, The Pains of Sleep, dans l'Edinburgh Review. Bien que Coleridge ait une idée de l'auteur de la revue, il n'a pas été possible d'identifier définitivement cette personne au cours des deux cents dernières années.
Qui était l'auteur, ou la personne qui a écrit un texte, est devenue une question à laquelle nous pouvions de plus en plus facilement répondre grâce aux ordinateurs d'analyse stylistique. Mais cette méthode a également soulevé de nouvelles questions sur le "rôle" de l'auteur. Il s'agit de savoir s'il est tout à fait significatif d'écrire quelque chose, et non si c'est l'écrivain ou le lecteur qui donne un sens au texte.
Dans le cas des approches algorithmiques qui ne savent rien de l'auteur, ni même de l'histoire, de l'idéologie ou des traditions critiques, la paternité émerge en force de la mer des textes comme un ensemble de schémas communs. C'est-à-dire que l'intelligence artificielle ou IA réussit à "reconnaître" un auteur non pas comme un être humain, mais comme une imitation des caractéristiques distinctives d'un ensemble d'œuvres. Le lecteur algorithmique utilise un ensemble de caractéristiques textuelles, telles que les mots courants et la ponctuation, pour trouver des modèles parmi les textes et déduire ce qui est écrit par qui.
Voici comment le processus fonctionne : lorsqu'elles sont vues dans un ensemble relativement cohérent de textes d'un seul auteur, les préférences linguistiques spécifiques à l'auteur sont des empreintes digitales. Pour reconnaître cette empreinte digitale, vous aurez besoin d'un ensemble de texte assez volumineux et similaire à comparer avec celui dont vous souhaitez trouver la source. Le texte dans votre main doit également être suffisamment long pour contenir des motifs d'empreintes digitales.[1] Les méthodes qui utilisent le style pour découvrir qui a écrit un texte anonyme ou pour vérifier qui l'a réellement écrit s'appuient sur le texte seul pour tirer des conclusions possibles.[2]
Dans 'l'analyse du style', le 'style' ressemble plus ...
[Courte citation de 8% de l'article original]