Bienvenue, Invité
Merci de vous identifier ou de vous inscrire.    Mot de passe perdu?
signifie que ce forum est verrouillé; pas de nouveaux messages possibles.
Paréidolie linguistique dans séquence de lettres aléatoire signifie que ce forum est verrouillé; pas de nouveaux messages possibles.
(1 lecteur(s)) (1) Invité(s)
Aller en basPage: 12
SUJET: Paréidolie linguistique dans séquence de lettres aléatoire
   12/03/11 à 18:48 #20996
Bilboquet
Contributeur important
Messages: 87
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
Sexe: Masculin bouphagos
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
anty28 écrit:
Je suppose qu'il faut se placer du point de vue du lecteur, sinon cette question n'a aucun sens, si le lecteur ne peut même pas deviner que le mot a une signification dans une certaine langue ; d'ailleurs je peux faire mieux avec xlp'xwltlpllskwc' (un mot d'une langue amérindienne).

Ca me rassure, il y a plus pervers que moi :-p
 
Le sujet a été verrouillé.
   12/03/11 à 18:51 #20997
saxncat
Contributeur extraordinaire !
Messages: 1575
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
Sexe: Masculin Lieu: 33
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
Bilboquet écrit:
saxncat écrit:
Déjà on peut éliminer tous les mots ne comportant que des consonnes et des voyelles, voire même des mots comportant un certain nombre (3 ou 4) de voyelles ou de consonnes consécutives.

Pour les 2 premières catégories, ça fait 350277500542221 mots et 48828125, soit 350277549370346 mots.

Reste 3320066937617430 mots de 11 lettres, soit environ 90% du stock initial.


Pas d'accord ! En hébreu, on écrit sans les voyelles !



Disons qu'on ne va garder que des langues civilisées :-) :-) :-)
 

La terre porte deux sortes d'hommes, des hommes intelligents sans religion et des hommes religieux sans intelligence. - [Abu’l Ala al Ma’arri]

Le sujet a été verrouillé.
   12/03/11 à 18:53 #20998
anty28
Contributeur extraordinaire !
Messages: 354
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
Sexe: Masculin ineakis Lieu: Paris Date anniversaire: 28/04
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
Je ne dirais pas cela, mais c'est certain que, si l'on prend des langues qui s'écrivent habituellement sans l'alphabet latin, ça peut être considéré comme de la triche...
 
Le sujet a été verrouillé.
   12/03/11 à 18:57 #20999
saxncat
Contributeur extraordinaire !
Messages: 1575
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
Sexe: Masculin Lieu: 33
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
Disons qu'avec les hiéroglyphes c'est aussi plus difficile.
 
Dernière édition: 12/03/11 à 18:58 Par saxncat.

La terre porte deux sortes d'hommes, des hommes intelligents sans religion et des hommes religieux sans intelligence. - [Abu’l Ala al Ma’arri]

Le sujet a été verrouillé.
   12/03/11 à 19:15 #21000
shisha
Contributeur extraordinaire !
Messages: 392
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
"Il y aurait à peu près 6 703 langues parlées dans le monde"

Parmi ces 6703 langues il faudra qu'on sache combien utilisent l'alphabet latin, ensuite on pourra multiplié 53026 par le nombre de langues utilisant l'alphabet latin, puis remultiplier par 2 (pour les mots à l'envers).

Quelques langues utilisant l'alphabet latin :
Espagnol
Portugais
Catalan
Occitan
Franco-provençal
Français
Italie
Roumain
L'allemand
 
Le sujet a été verrouillé.
   14/03/11 à 10:17 #21019
Bilboquet
Contributeur important
Messages: 87
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
Sexe: Masculin bouphagos
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
npatrois a créé un petit programme bien efficace ici : www.zetetique.fr/index.php/forum/16-disc...0&start=50#21018
je vais le tanner pour qu'il transfère ça ici :-)
 
Le sujet a été verrouillé.
   14/03/11 à 18:22 #21033
npatrois
Faut pas croire, faut savoir.
Contributeur extraordinaire !
Messages: 1010
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
Bon, je poste ici mes petits programmes.

Le premier en Python génère mille mots aléatoires dans le fichier 1000mots.txt.

Code :


#!/usr/bin/python
# -*- coding: UTF-8 -*-

from random import seed, randint
seed()

liste="abcdefghijklmnopqrstuvwxyz"
j=0

while j<1000:
  hasard=""
  i=0
  while i < 11:
    hasard+=liste[randint(0, 25)]
    i+=1
  print (hasard)
  j+=1



À utiliser ainsi :

Code :


./lettres-au-hasard.py > 1000mots.txt



Le deuxième en Python aussi crée un dictionnaire de mots ni trop longs ni trop courts :

Code :


#!/usr/bin/python
# -*- coding: UTF-8 -*-

idico = open('../francais2')
odico = open('francais','w')

for mot in idico:
  if 4 < len(mot) < 12:
    odico.write(mot)

odico.close()
idico.close()



Le dernier en shell permet de faire la liste des vrais mots trouvés dans le travail du singe savant.

Code :


#!/bin/bash

if [ -e trouves.tmp ] ; then rm trouves.tmp ; fi

for i in $(cat francais);
  do grep $i -i 1000mots.txt >> trouves.tmp
done

sort trouves.tmp|uniq > trouves.txt
rm trouves.tmp



J’ajoute les fichiers obtenus.
Fichier attaché :
Nom de fichier : 1000mots-20110314.txt
Taille de fichier : 12000

Fichier attaché :
Nom de fichier : trouves-20110314.txt
Taille de fichier : 492


Il a trouvé 41 mots simiesques contenant de vrais mots de plus de cinq lettres.
 
Dernière édition: 14/03/11 à 18:32 Par npatrois.
L’homme descend du singe, or l’homme est fait à l’image de Dieu. Donc Dieu est King Kong.
-+- Cavanna, François -+-
Le sujet a été verrouillé.
   19/03/11 à 14:57 #21120
npatrois
Faut pas croire, faut savoir.
Contributeur extraordinaire !
Messages: 1010
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
Hop, le retour, mais tout en Python, cette fois, et avec des commentaires.

D’abord la création aléatoire de mots de onze lettres, très rapide.

Code :


#!/usr/bin/python
# -*- coding: UTF-8 -*-

from random import seed, randint
from os import remove, access, F_OK

# Suppression éventuelle du fichier aléatoire restreint, puis ouverture

if access('1000mots.txt',F_OK):
  remove('1000mots.txt')
milmot = open('1000mots.txt','w')

# Initialisation du hasard

seed()

liste="abcdefghijklmnopqrstuvwxyz"
j=0

# Écriture du fichier

while j<1000:
  hasard=""
  i=0
  while i < 11:
    hasard+=liste[randint(0, 25)]
    i+=1
  milmot.write(hasard+'\n')
  j+=1

# On ferme

milmot.close()



Fichier attaché :
Nom de fichier : 1000mots-20110319.txt
Taille de fichier : 12000


Ensuite filtrer un dictionnaire existant pour limiter la taille des mots, très rapide aussi.

Code :


#!/usr/bin/python
# -*- coding: UTF-8 -*-

from os import remove, access, F_OK
from sys import argv

# Traitement des entrées en ligne de commande
# Nombre de lettres minimum et maximum
# Valeurs par défaut : 4 et 11

try:
  mini=min(int(argv[1]),int(argv[2]))
except:
  mini=4
try:
  maxi=max(int(argv[1]),int(argv[2]))
except:
  maxi=11

# Dictionnaire original

idico = open('../francais2', 'r')

# Suppression éventuelle du dictionnaire restreint, puis ouverture

if access('francais',F_OK):
  remove('francais')
odico = open('francais','w')

# Remplissage du dictionnaire si le mot original est ni trop long ni pas assez

for mot in idico:
  if mini < len(mot) < maxi:
    odico.write(mot)

# On ferme

odico.close()
idico.close()



Le dictionnaire obtenu est trop gros (560 ko au lieu de 120 ko autorisés).

Enfin le tri des mots trouvés dans les mots aléatoires, en deux minutes et demie en Python, en douze en shell.

Code :


#!/usr/bin/python
# -*- coding: UTF-8 -*-

from os import remove, access, F_OK

# Recréation du fichier qui contient les résultats

if access('trouves.txt',F_OK):
  remove('trouves.txt')
trouves = open('trouves.txt','w')

# D’où viennent les mots aléatoires

milmot=open('1000mots.txt','r')

# On dresse la liste des mots aléatoires

for mot in milmot:
  motb=mot.strip() # On supprime le caractère non imprimable à la fin
  dico=open('francais','r') # On doit ouvrir le dictionnaire à chaque fois
  for dic in dico:
    dicb=dic.strip()
    lon=len(dicb)
    nb=len(motb)-lon
    i=0
    while i<nb:
      if motb[i:i+lon]==dicb: # Test si on trouve le mot du dictionnaire dans le mot aléatoire à la position i
        trouves.write(motb+"\n") # On écrit le mot aléatoire
        trouves.write(" "*i+dicb+"\n") # Et le mot du dictionnaire juste en dessous
      i+=1
  dico.close()

# On ferme

milmot.close()
trouves.close()



Ça donne 175 mots entre trois et onze lettres, comme par exemple :

Code :


vwipysomatx
       mat
phivifikdzg
   vif
[…]
hbusenlskkm
 buse
[…]
lightpopesj
     popes



Fichier attaché :
Nom de fichier : trouves-20110319.txt
Taille de fichier : 3404
 
Dernière édition: 19/03/11 à 21:39 Par npatrois.
L’homme descend du singe, or l’homme est fait à l’image de Dieu. Donc Dieu est King Kong.
-+- Cavanna, François -+-
Le sujet a été verrouillé.
   19/03/11 à 22:57 #21128
Bilboquet
Contributeur important
Messages: 87
Personne n'est hors ligne Cliquez ici pour voir le profil de cet utilisateur
Sexe: Masculin bouphagos
 Re:Paréidolie linguistique dans séquence de lettres aléatoire
npatrois écrit:

[…]
hbusenlskkm
buse
[…]
lightpopesj
popes
[/code]


J'aime beaucoup le "lightpopes" !
Il faudrait de facto intégrer au dico, comme évoqué en début de fil, plusieurs dicos courant de l'honnête homme moderne (anglais, espagnol, italien)...
Et éventuellement refaire le test avec des langues moins honnêtes, puis avec des langues non latines mais ésotériquement pleines de sexappeal (hébreu notamment).
On aurait la totale des situations !

Mon t'y python, vl'a un sacré graal !
 
Le sujet a été verrouillé.
Revenir en hautPage: 12
Modérateur: Bobby, Jerem
Développé par KunenaObtenir les derniers messages directement sur votre PC - Version française:SFK