On désigne parfois les outils qui analysent des données numériques par "number crunchers"; certains auteurs ont, de façon analogue, désigné par "Word Cruncher", les outils de l'analyse de contenu traditionnelle basée sur l'analyse de fréquences (simples, co-occurrences etc) de mots, de codes etc. C'est aussi sous ce terme que l'auteur d'Atlas a placé une collection d'outils à venir dans les futures version d'Atlas.ti, dont les seuls représentants pour l'instant sont le décompte des fréquences de mots. et les nuages de mots (voir ce document pour les Word Clouds

Fréquences de mots

produit un tableau de fréquences de tous les mots d'un texte primaire (le texte courant) ou de tous les textes primaires d'une HU.

La boîte de dialogue permet d'indiquer une série d'options, notamment:

OK lance le processus.

Par défaut et avec un seul texte primaire, Atlas.ti affiche la liste ci-contre (qui a été ordonnée en cliquant sur la colonne contenant les fréquences). Vous avez la possibilité d'ordonner sur une des colonnes en cliquant sur l'entête. C'est une liste brute, donc tous les mots qui s'y trouvent sont listés sans aucune différenciation et il n'est pas très étonnant de retrouver "de", "le" et "la" en tête, des mots qui dans une analyse ne sont pas très utiles.

Sortie vers d'autres logiciels

Si vous sélectionnez Excel comme destination, Atlas.ti sauvera les résultats dans un fichier externe et lance ensuite le tableur qui traite ce type de fichiers, souvent Excel. Cette option est surtout intéressante si WordCruncher opère sur toute une série de textes primaires pour produire une matrice dans laquelle figurent les fréquences des mots par document primaire.

On pourra ainsi obtenir un tableau comme celui visible ci-contre (affiché dans EXCEL). La première colonne contient les mots comptés, et dans chaque colonne on trouve un document primaire (l'entête indique son numéro: "P 15" signifie le document primaire numéro 15.)

Liste de mots "Stop" ou "Go"

Il est possible d'exclure certains mots du décompte, typiquement des particules genre, "de", "à", "le" ("mots vides"); la liste de ces mots à exclure ("Stop list",) se trouve dans un fichier qui s'appelle par défaut stoplist.txt (vous pouvez l'éditer ou fournir un autre fichier. S'agissant d'un logiciel d'origine non-francophone ce fichier par dégaut ne contient bien sûr pas les particules etc du français; il faut donc créer un (dans l'illustration cela a été fait).

En cherchent un peu vous trouverez peut être des listes de mots (stopwords) qui conviennent, notamment sur le site , www.ranks.nl/stopwords en plusieurs langue et sur ce site en allemand

Si vous déselectionez l'option Exclude words le fichier indiqué sera traité comme une liste qui contient tout les mots à inclure dans le décompte (dans le jargon on parle alors d'une Go list, une list de sélection positive); seuls les mots figurant dans ce fichier seront comptés.

Le fichier se trouve en général dans le répertoire utilisateur Atlas.ti, mais vous pouvez indiquer un autre endroit. Voici les règles concernant ce fichier:

Remarques générales