309 messages over 39 pages: << Previous 1 2 3 4 5 6 7 ... 30 ... 38 39 Next >>
emk Diglot Moderator United States Joined 5530 days ago 2615 posts - 8806 votes Speaks: English*, FrenchB2 Studies: Spanish, Ancient Egyptian Personal Language Map
| Message 233 of 309 21 September 2014 at 6:14pm | IP Logged |
s_allard wrote:
Secondly, I say let's look at an actual conversation of people talking about family. Again, I include at the end of this post a transcription of such a conversation of people talking about triplets in a family. This is from that wonderful site France Bienvenue.
(…snipped, original here…)
|
|
|
During this long thread, I've been working on text processing libraries based on the excellent Lexique3 data set. These may somebody become part of an extensive reading tool. But as of this morning, my tools are finally good enough that I can process actual French conversations against a vocabulary list.
For this experiment, I'm using a 400-word vocabulary list based on film frequency data. If you speak French, you can see that this list is full of useful, common words:
Quote:
400 top words: être, avoir, je, de, ne, pas, le, la, tu, vous, il, et, un, à, l', aller, les, en, ça, faire, on, une, ce, d', pour, des, dire, tout, pouvoir, qui, vouloir, mais, me, nous, dans, savoir, elle, du, y, bien, t', voir, que, plus, non, te, mon, au, avec, moi, si, devoir, s', oui, ils, comme, se, venir, sur, toi, quoi, ici, rien, ma, lui, bon, où, là, suivre, pourquoi, parler, prendre, cette, votre, quand, son, alors, ton, chose, par, croire, aimer, falloir, comment, très, ou, passer, penser, aussi, jamais, même, attendre, petit, trouver, laisser, merci, sa, autre, ta, arriver, ces, donner, regarder, encore, appeler, est-ce que, peu, homme, partir, mes, toujours, jour, femme, temps, maintenant, notre, vie, deux, mettre, rester, sans, seul, arrêter, vraiment, connaître, quelque, sûr, juste, tuer, mourir, demander, peut-être, dieu, fois, oh, père, comprendre, sortir, personne, an, trop, vrai, chez, fille, aux, monde, ami, mal, après, avant, besoin, accord, ses, beau, monsieur, grand, enfant, entendre, voilà, chercher, heure, mieux, déjà, tes, aider, mère, essayer, quel, vos, depuis, quelqu'un, beaucoup, revenir, donc, plaire, maison, gens, nuit, ah, soir, nom, bonjour, jouer, finir, peur, mort, parce que, perdre, maman, sentir, ouais, rentrer, nos, argent, vivre, premier, problème, quelle, rendre, dernier, tenir, cet, main, cela, vite, moins, oublier, air, salut, fils, travailler, demain, tête, manger, coup, écouter, raison, amour, entrer, fait, devenir, nouveau, hein, commencer, merde, moment, voiture, vieux, revoir, elles, payer, fou, tirer, ouvrir, oeil, changer, question, tomber, assez, foutre, excuser, affaire, dormir, combien, frère, travail, idée, eh, puis, famille, tard, truc, trois, tant, souvenir, ni, tous, occuper, entre, ok, marcher, chance, envoyer, aujourd'hui, histoire, prêt, jeune, apprendre, minute, boire, garder, quelques, type, porte, montrer, mec, porter, asseoir, contre, pendant, attention, droit, année, sous, prier, meilleur, mois, lire, servir, plein, madame, putain, écrire, part, eau, sang, place, espérer, gros, désoler, eux, retrouver, ville, terre, gagner, semaine, acheter, longtemps, gars, chambre, hé, côté, ensemble, leur, rappeler, fort, cas, mot, seulement, toucher, voici, monter, désolé, quitter, police, suite, matin, emmener, devant, continuer, cher, enfin, pardon, mari, mauvais, là-bas, point, importer, papa, vers, heureux, feu, train, manquer, raconter, film, car, répondre, garçon, chéri, leurs, corps, celui, autres, loin, aucun, sauver, pauvre, chaque, retourner, fin, rencontrer, coeur, voler, fermer, valoir, descendre, docteur, important, suffire, façon, sembler, dehors, super, compter, aucune, joli, tiens, noir, hier, chien, dont, guerre, genre, marier, arme, cause, endroit, possible, ordre, poser, reste, pied, envie, près, inquiéter, d'autres, bouger, boulot, plutôt |
|
|
Why 400 words and not 300? Well, this allows for near-duplicates like rester and reste that Lexique treats as separate lemmas. And I want to give the 300-word hypothesis the benefit of the doubt.
Now, let's take s_allard's conversation, and remove any words which aren't on our list. We'll throw in proper nouns for free. But remember, this isn't a precise science, and a couple of these words should probably not have been removed.
Quote:
Conversation with unknown words hidden.
A : Alors, bonjour à XXXXXX les trois.
C,S,V : Bonjour.
A :Trois filles. Et donc…, bon, il y a d’XXXXX…
V : Véronique.
C : Claire.
S : Et Sophie.
A : Et alors, vous avez un XXXXX XXXXXX en fait.
V : Oui. On est XXXXXXXX.
A : Oui, c’est ça. Vous êtes pas seulement XXXXX, vous êtes…
S : XXXXXXXX.
C : On est XXXXXXXX. Donc on est XXXX XXXXXX les trois le même jour, comme des XXXXXXX, à part qu’on est trois.
A : D’accord. A part que (1) vous êtes trois ! A part que ! Je sais pas si votre maman, elle a dit ça quand elle a XX
ça !
C : Non !
V : En plus, à la XXXX (2), il y en avait que deux.
A : Comment ça ? (3)
V : Bah ils en avaient XX que deux.
A : Ah ! C’est ça, à l’XXXXXXXXXXX, on voyait que deux ! Waouh ! Elle a XXXXXXXXX…
V : Oui, plus tard.
C : A l’XXXXXXXXXXX du XXXXXXXXX mois, on lui avait dit… Vous êtes pas… enfin, il y en a pas trois… Il y en a pas
deux, il y en a trois.
V : J’étais XXXXXX.
A : C’est vrai ?
C : Du coup, ça a été le XXXX. Et puis en plus, ils lui avaient dit : Vous avez deux garçons, sûr, et une fille peut-
être. Donc à la XXXXXXXXX, elle a XXXXXXXXX, le jour J, sous XXXXXXXXXX…
A : Qu’il y avait trois filles !
C : Qu’il y avait une, deux et trois filles.
A : Quelle XXXXXXXX !
S : Voilà !
A : J’aimerais bien XXXXXXXXXX votre maman, là, parce que elle doit avoir des XXX de trucs à raconter ! Ah ouais,
non c’est XXXXXX (4), ça. Mais alors du coup, donc trois filles, mais il y en a quand même deux qui se XXXXXXXXXXX.
V : Oui.
A : Alors, qu’est-ce que c’est, cette histoire-là ?
V : Bah en fait, c’est deux vraies XXXXXXXX et moi, je suis une XXXXXX XXXXXXX. On était dans deux XXXXXX
XXXXXXXXXXX.
A : Oui, oui.
V : Et donc…
A : C’est XXXXXXXXXX, hein, ce que la XXXXXX peut faire ! C’est vraiment… Bon, et donc, XXXXXX les deux, Claire et
Sophie, vous vous XXXXXXXXXX, mais XXXXXXXXXX, pas tant que… enfin… Si, vous vous XXXXXXXXXX. Vous êtes des
vraies XXXXXXXX.
C : Oui, on est des vraies XXXXXXXX, 100 % vraies XXXXXXXX. Et après, ça XXXXXX des gens. Des gens nous disent
qu’on se XXXXXXXXX XXXXXXXXXX…
A : Bah, au XXXXX, moi j’ai…
C : Et d’autres, non.
A : J’ai eu du mal (5), quoi, vraiment, je me disais : J’arriverai jamais à les XXXXXXXXXXXX. Bon, Véronique, c’était
bon, pas de problème, mais… Et puis en fait, XXXXXXXXXX, en vous XXXXXXXXX… enfin, à XXXXX de vous XXXXXXX, je
me dis… J’ai déjà eu des XXXXXXX, et vraiment, une année, c’était des XXXXXXX, mais alors (6)!
S : Deux XXXXXXX d’eau (7).
A : Vraiment !
C : Copie-XXXXX.
A : Ah ouais, XXXXX-XXXXX (8)! C’était XXXXXXXXXXXXXX. Alors que là, je sais pas, c’est quoi ? Peut-être, comme vous
disiez, le XXXXXXXXXX, ou…
C : Le XXXXXXXXXX aussi. On fait une XXXXXX au XXXXXX de la XXXXXXXX. Elle a la XXXXX (9) sur le côté, moi, non.
A : Mais quand même, il y a quelque chose qui fait que c’est pas tout à fait ça. Bon et alors, qu’est-ce que ça fait
d’être, comme ça… enfin… je veux dire au XXXXXX des XXXXXXXX entre vous et… Parce que XXXXXXX, XXXXXX les
deux, Claire et Sophie, vous êtes XXXXXXX ensemble et puis Véronique, elle est XXXXXXXX.
V : Oui. Moi, je suis toujours à part.
A : Trois, c’est un petit… C’est un XXXXXX pas XXXXXX, quoi, dans une famille.
V : Beh… A l’XXXXX, il y a toujours des XXXXXXX de deux. Donc du coup, bon XXX mes XXXXX sont à côté, XX que…
S : Ça s’est toujours XXXXX comme ça.
A : Oui.
V : Tout le temps, quand il y a eu deux, XXX mes XXXXX se sont XXXXX à côté et moi, j’étais avec un XXXXXX ou une
XXXXXX.
A : Et vous vous sentiez XXXXXXXXXX ou… ?
V : Non. Non. C’est que je…
S : On est quand même XXXXXXXXXX…
C : Un petit peu plus XXXXXXX. Voilà.
S : Légèrement.
A : Ça se sent, ça ?
V : Du coup, je savais que…
V,F,C : Oui. Après…
C : Donc pour nous…
V : Elles avaient besoin d’être XXXXXXX à côté (10).
C : Voilà. C’est plus XXXXXXX que je sois XXXXXX à côté de Sophie qu’à côté de Véro. Après… Enfin, voilà…
A : Vous êtes vraiment des XXXXX.
C : Voilà. Enfin, on aime nos XXXXX… enfin, j’aime mes XXXXX XXXXXX l’une que l’autre, mais c’est vrai que…
A : Mais des vraies XXXXXXXX, c’est quelque chose de XXXXXXX.
C,S : On est plus…
V : Il y a un petit plus.
A : On peut XXXXXXXXX ça ? Comment… Qu’est-ce que vous diriez ?
S : Je sais pas.
C : On arrive à se comprendre sans qu’on se parle (11). C’est vrai que Sophie, si elle est mal, pas besoin qu’elle
me dise : « Claire, je suis mal ». Je sais qu’elle est mal. Je le XXXX, je le vois. Et elle aussi.
S : Et on se connaît vraiment par XXXX (12). Il y a pas de…
C : Et XXXXXXX, quand elle est mal, je lui dis : « Sophie, tu es mal ». Elle me dit « non ». Je lui dis : « Sophie, arrête
de me XXXXXX », parce que je sais que c’est pas vrai, quoi. C’est l’XXXXXXX quand c’est moi pour… Voilà ! Et du
coup…
A : Ouais, c’est XXXXXXXXX, ça, hein !
C,S : Oui.
A : Et est-ce que vous pouvez vous XXXXXXX ?
V,C,S : Ah oui.
C : On peut se XXXXXXX.
V : On peut faire XXXXXXX notre vie (13) de notre côté. Après, bon, c’est vrai que pour les XXXXXX, c’est plus
XXXXXXXXXX (14). Et puis XXXXXX tout, c’est vrai qu’on a eu les XXXXX XXXXX XXX le XXXXXX.
A : C’est ça quand même, parce que XXXXXXXXXX, c’est quand même…
S : C’est vrai qu’on a les XXXXX XXXXX, le même XXXXXX XXXXXXXXXXXX.
A : Heureusement, parce que XXXXX, vous auriez pas pu faire les XXXXX XXXXXX. Mais… mais, bon, en même
temps… Moi j’ai des amis aussi qui ont des XXXXXXX. Mais alors les garçons sont vraiment dans des choses
XXXXXXXXXX XXXXXXXXXXX. Bon, c’est pas des vrais XXXXXXX, hein, c’est sûr. Mais vraiment, ils font des XXXXXX qui
n’ont rien à voir (15), et depuis très longtemps. Ils ont… En fait, très vite, ils n’ont jamais été ensemble en XXXXXX.
Ils étaient XXXXXXX, et tout. Mais vous, vous…
S : Ah nous, on a toujours demandé à être dans la même XXXXXX.
V : Et les XXXXXXXXXXX nous disaient qu’ils nous laisseraient ensemble tant qu’ils [voient] (16) que tout se XXXXX
bien et que il y en a pas une qui se XXXXXX sur les deux autres, ou deux qui se XXXXXXXX sur une. Et XX que bon,
on a toujours XXXXXXXXX XXXXXXX quand même au même XXXXXX, de la même façon…
A : Mais alors par XXXXXXX, bon, OK, les XXXXXX, vous avez XXXXXX, vous êtes ici, tout ça. Mais par XXXXXXX, un
travail, des fois, enfin, ça va pas être XXXXXXX. Ils vont pas vous prendre les trois dans la même XXXXXXXXXX !
S : Bon XXX ça, on s’y XXXXXXX.
C : Déjà, même pour le XXXXX (17), on est dans trois XXXXXXXXXXX XXXXXXXXXXX.
A : Mais est-ce que par XXXXXXX, vous pourriez… je sais pas… vivre dans trois villes XXXXXXXXXXX ?
C,S,V : Oui !
S, V : Si c’est pas trop loin !
A : Pas trop loin !
S : Pas trop, trop loin quand même !
V : Une heure XXXXXXX de XXXXX, hein !
C : Voilà. Je pense qu’on s’appellerait quand même très XXXXXXX.
V,S : Tous les jours, c’est sûr !
C : Si c’est pas deux fois par jour (18). On verra, mais… Voilà !
V : C’est vrai que même XXX que… enfin, moi, je sais que XXX que je m’XXXXXX, si je suis pas avec mes XXXXX, que
je suis XXXXXXXX, XXX XXXXXXXXX, je vais de suite (19) les appeler. Je me dis pas : Bon, XXX je vais rester là à rien
faire. Non, non. J’ai besoin de les appeler. Vous faites quoi ? Ah vous faites ça. Ah XXX alors je vais faire ça aussi
moi de mon côté.
A : Oui, oui , oui. C’est XXXXXXX, hein ! Et alors XXXXXXXXX, quand vous étiez enfants, par XXXXXXX, c’est ça, vous
aviez toujours quelqu’un pour jouer !
C,S,V : Oui ! Ça ! Alors là… !
V : C’est sûr qu’on s’est jamais XXXXXXXX.
S : On était… Ça, c’était super, super. Toujours une avec une idée donc…
A : Oui oui. Et l’autre qui XXXXXXXX. Ah ouais, c’est XXXXXX, ça, hein ! Et est-ce que ça… Est-ce que ça XXXXXXXXX
pas un peu les autres à l’XXXXX ?
V : Non, XXX…
A : Ça a pas XXXXXXX ?
S : Non, parce que…
V : On a toujours été très…
S : … XXXXXXXXX.
V : Voilà.
C : On parle beaucoup aux gens. Même si on les connaît pas, on fait XXXXXXXXXX XXXXXXXXXXXX. On n’est pas à ne
pas parler (20).
A : Ça vous XXXXX pas.
S : Voilà.
C : On aime bien avoir beaucoup de monde XXXXXX de nous.
A : C’est… c’est ce que j’ai XXXXXXXX. Parce que c’est vrai qu’on se dit, bon, XXX des fois, voilà, si vous êtes
XXXXXX XXXXXXXXXXXX (21), ça pourrait peut-être mettre les autres un peu à l’XXXXX, et tout. Et en fait, c’est pas du
tout le cas.
S : Ah non ! Non !
A : Et puis ils vous XXXXXXXXXX beaucoup, et tout… tout ça !
C,S,V : Oui !
A : Oui, oui. Ça se voit (22). D’accord.
(à suivre…) |
|
|
I don't know about you, but I can't get much out of this conversation, not having read the original. I mean, I like extensive activities very early on, but this is too much even for me.
Anyway, here are the words which occurred in this conversation, but which weren't on our top 400 list:
Quote:
Unknown words in this conversation (count): jumeau (9), bah (8), sœurs (7), différent (5), triplé (4), toutes (4), ressembler (4), exemple (4), étude (4), vu (3), souvent (3), mêmes (3), dès (3), séparer (2), niveau (2), maquillage (2), goût (2), finalement (2), entreprendre (2), échographie (2), écart (2), découvert (2), copain (2), coller (2), classer (2), chacune (2), autant (2), assis (2), troisième (1), travaillé (1), totalement (1), tas (1), su (1), stage (1), spécial (1), sociable (1), sinon (1), séparé (1), sens (1), rythmer (1), route (1), rigolo (1), reposer (1), repose (1), remettre (1), remarquer (1), regardant (1), rapport (1), rapidement (1), profil (1), professeur (1), proche (1), préparer (1), poindre (1), pocher (1), passé (1), passe (1), nuancer (1), nombre (1), né (1), naturel (1), nature (1), naissance (1), mise (1), mentir (1), mèche (1), maximum (1), marrer (1), malgré (1), maintenir (1), légèrement (1), justement (1), juneaux (1), isoler (1), inverser (1), interroger (1), intellectuel (1), incroyable (1), impressionner (1), goutter (1), génial (1), fusionnelles (1), forcément (1), force (1), fausser (1), fasciner (1), facile (1), expliquer (1), évider (1), énormément (1), ennuyer (1), ennuyé (1), enchaîner (1), empêché (1), école (1), différencier (1), derrière (1), dépendre (1), départir (1), début (1), côtoyer (1), copier (1), connaissance (1), commun (1), coiffure (1), cœur (1), choisi (1), choc (1), césarienne (1), caché (1), bureau (1), baser (1), aventurer (1), autour (1), assise (1), arrangeant (1), apprécier (1), ailleurs (1), abord (1) |
|
|
A few of these are inflected forms of our 400 words. Sometimes those inflections would be obvious even to a novice; other times there's a huge difference between the inflected and the base forms, and a novice would need to learn them separately. But overall, these words fall into two categories: (1) words which are specific to this conversation, and (2) perfectly ordinary words which don't fall into the top 400.
Now, if you were a beginning French student, you could repair this conversation:
1. You could ask for words to be defined, try pantomime, etc.
2. You could butcher the grammar and the pronunciation, and say "Pardon?" every 5 seconds. This will cause most native speakers to take pity on you and explain everything with really simple words and hand gestures. Ironically, having an excellent accent and a total mastery of your 400 words would probably make the situation worse, because a good accent and fluid speech will cause native speakers to speed up massively and cut you much less slack. Instead of thinking that you're a foreigner learning French, they'll tend to assume that you're stupid or uncooporative.
3. You could adjust your 400-word list to be based on your personal needs, and not a onfrequency list. But remember, for every word like sœur "sister" that you add to your 400, you've got to remove a word that's already there.
4. You could learn 10 or 20 new words before each conversation to fill in the most glaring holes.
If you combine these solutions, you could actually get pretty far with the top 400 words, a lot of pantomime, and a short cram session before each conversation. In other words, it looks like you really can speak very early if that's how you like to approach things. But at the same time, you can also see the limits of such a tiny vocabulary: You miss an alarming amount of the typical conversation.
Edited by emk on 21 September 2014 at 7:57pm
9 persons have voted this message useful
|
emk Diglot Moderator United States Joined 5530 days ago 2615 posts - 8806 votes Speaks: English*, FrenchB2 Studies: Spanish, Ancient Egyptian Personal Language Map
| Message 234 of 309 21 September 2014 at 9:11pm | IP Logged |
I know we've beaten the whole "Can you take the DELF B1 with a 300-word vocabulary" question into the ground. :-) And I usually try not to reply to my own posts. But now that I have the software to simulate a B1 exam with limited vocabulary, I thought it would be fun to try.
We're going to tackle reading comprehension. First, let's give our student a fighting chance, and replace the movie frequency list with one derived from books:
Quote:
Top 400 words, Lexique3 book corpus. de, la, être, et, le, avoir, à, les, il, l', un, ne, d', en, je, des, une, pas, dans, qui, elle, du, se, pour, s', tout, ce, sur, faire, au, plus, dire, on, son, mais, me, lui, avec, nous, comme, par, sa, vous, que, y, ses, aller, ils, pouvoir, bien, tu, ça, ou, voir, cette, mon, sans, même, où, savoir, aux, moi, si, petit, ma, vouloir, peu, encore, deux, ces, rien, autre, venir, quand, prendre, homme, grand, devoir, aussi, jour, temps, falloir, oeil, main, passer, fois, non, jamais, très, puis, parler, là, toujours, mettre, chose, alors, sous, mes, bon, vers, regarder, femme, seul, demander, trouver, dont, après, suivre, croire, heure, tête, leurs, donner, penser, vie, laisser, premier, coup, entre, aimer, rester, trop, devant, t', te, mère, cela, monde, tenir, nuit, avant, moins, quelques, enfant, père, arriver, entendre, sentir, attendre, déjà, vieux, peut-être, air, moment, an, notre, chez, beau, quelque, ni, trois, depuis, sortir, oui, connaître, porte, jeune, long, comprendre, voix, elles, noir, contre, quoi, fille, nos, maison, sembler, côté, mort, visage, rue, soir, mal, mot, devenir, personne, eux, blanc, cet, maintenant, ouvrir, revenir, dernier, car, bras, pied, pourquoi, chaque, partir, ici, corps, sourire, nouveau, porter, rire, vivre, ainsi, place, rendre, vrai, répondre, presque, appeler, pendant, français, arrêter, beaucoup, eau, ton, terre, loin, toi, lever, derrière, chercher, paraître, donc, près, tomber, enfin, plein, mieux, tant, votre, leur, regard, commencer, comment, assez, finir, retrouver, fin, chambre, sûr, souvenir, haut, gens, poser, fait, monter, amour, coeur, peine, entrer, bout, seulement, point, matin, dieu, asseoir, nom, mourir, gros, tirer, ami, table, perdre, tourner, fond, pourtant, année, autres, fort, autour, tard, histoire, droit, instant, guerre, ville, vite, doute, force, ailleurs, écrire, rouge, reprendre, jeter, lit, bas, jouer, longtemps, lire, soleil, général, voilà, question, idée, parce que, marcher, silence, monsieur, est-ce que, part, celui, quitter, mur, écouter, peur, ceux, raison, tour, sorte, ciel, mois, descendre, celle, bois, ah, essayer, surtout, retourner, pousser, épaule, train, route, parfois, oublier, souvent, apprendre, livre, servir, juste, tendre, manger, bouche, voiture, continuer, quatre, bruit, plutôt, fenêtre, rentrer, façon, montrer, boire, pièce, suite, dès, famille, vraiment, lumière, soudain, geste, face, cheveu, lieu, besoin, quel, bleu, travail, courir, garçon, raconter, dormir, envie, mer, garder, milieu, doigt, lettre, affaire, feu, ta, travers, fils, changer, quelle, pays, imaginer, pauvre, autant, crier, tous, froid, ordre, aucun, expliquer, plaisir, ombre, apercevoir, chemin, verre, glisser, reconnaître, bord, vide, possible, ajouter, recevoir, gauche, propre, lèvre, présent, jambe, cinq, vent, fou, occuper |
|
|
Again, if anybody wants to build a better word list, I'd love to have one. I think there's too much fiction in this corpus.
Next, let's grab two (out of five) paragraphs from this sample DELF B1 exam, and hide all the words that aren't on our list. Once again, there are probably a couple of mistakes in the hiding process:
Quote:
DELF B1 excerpt.
XXXXX les XXXXXXXXXX dans le monde du travail
Les XXXXXXXXX XXXXXXXXXXX XXXXXXX XXXXXXXX de forts XXXXXXXX dans le monde du travail. La XXXXXXX XXXXXXX pour l'XXXXXX en leur XXXXXX entend les XXXXXXXXX. Elle est XXXXXXX par une XXXXXXX de la XXXXXXXXX sur les XXXXXXX d'XXXX par le Travail.
XXXXXXXXXXX, 26% des XXXXXXXXX XXXXXXXXXXX sont au XXXXXXX. En XXXXX, XXXXX beaucoup, les XXXXXXXX dont elles sont XXXXXXXX. XXXXXXXX que la XXXXXXXX XXXXXXX pour l'XXXXXX en leur XXXXXX, qui vient de XXXXXXX, entend XXXXXXXXX. L'XXXXXXXXXXX pour la XXXXXXX du XXXXX pour l'XXXXXXXXX* XXXXXXXXXXXXXXX des XXXXXXXXX XXXXXXXXXXX (Agefiph) et la XXXXX pour l'XXXXXXXXXX du XXXXXXX XXXXXXXX au travail (Adapt) veulent XXXXXXXXX autour du XXXXXX "XXXX, c'est XXXXXXX".
…
* XXXXXXXXX : XXXXXXXXXXX
Unknown words from this excerpt. adaptation, agir, aider, association, aujourd'hui, causer, centrer, chômage, combattre, débuter, diminué, emploi, faveur, fondre, gestion, handicapé, handicaper, insertion*, intégration, liguer, marqué, mobiliser, neuvième, personnes, physique, polémiquer, préjuger, professionnel, repris, réussir, ruer, selon, semaine, sixième, slogan, victime. |
|
|
Ouch. That's not going to be a fun exam. Granted, if we already know English, we'll pick up a bunch of vocabulary for free. Interestingly, it doesn't really make any difference if we use the movie vocabulary instead. But this does raise an important point: If you want to understand conversation, and read novels, and read newspapers, it's hard to build one vocabulary list for all three.
Now, you could almost certain do better with this example if you chose a better vocabulary list. Does anybody happen to have a couple million words of French newspaper articles sitting around in a text file for us to analyze?
Edited by emk on 21 September 2014 at 9:22pm
5 persons have voted this message useful
| Bao Diglot Senior Member Germany tinyurl.com/pe4kqe5 Joined 5764 days ago 2256 posts - 4046 votes Speaks: German*, English Studies: French, Spanish, Japanese, Mandarin
| Message 235 of 309 21 September 2014 at 10:16pm | IP Logged |
... I do think you would have to allow for a passive vocabulary that is at least threefold bigger, but I think that reinforces the artificial division between active and passive vocabulary where, I think, reality would be much better represented by a gradient.
And if, like s_allard stated repeatedly before, you are talking about proficient usage of the words on the 'active' end that means you don't only need to know those words, but also all of their collocations and the expressions they commonly occur in - which, I think, accounts for far more than some 300 lexical items.
4 persons have voted this message useful
| Medulin Tetraglot Senior Member Croatia Joined 4666 days ago 1199 posts - 2192 votes Speaks: Croatian*, English, Spanish, Portuguese Studies: Norwegian, Hindi, Nepali
| Message 236 of 309 22 September 2014 at 12:49am | IP Logged |
300 words is too few.
Even Basic English of Ogden's fame has 850 words.
1 person has voted this message useful
| s_allard Triglot Senior Member Canada Joined 5428 days ago 2704 posts - 5425 votes Speaks: French*, English, Spanish Studies: Polish
| Message 237 of 309 22 September 2014 at 4:16am | IP Logged |
emk wrote:
...
Anyway, here are the words which occurred in this conversation, but which weren't on our top 400 list:
Quote:
Unknown words in this conversation (count): jumeau (9), bah (8), sœurs (7), différent (5), triplé (4),
toutes (4), ressembler (4), exemple (4), étude (4), vu (3), souvent (3), mêmes (3), dès (3), séparer (2), niveau (2),
maquillage (2), goût (2), finalement (2), entreprendre (2), échographie (2), écart (2), découvert (2), copain (2),
coller (2), classer (2), chacune (2), autant (2), assis (2), troisième (1), travaillé (1), totalement (1), tas (1), su (1),
stage (1), spécial (1), sociable (1), sinon (1), séparé (1), sens (1), rythmer (1), route (1), rigolo (1), reposer (1),
repose (1), remettre (1), remarquer (1), regardant (1), rapport (1), rapidement (1), profil (1), professeur (1),
proche (1), préparer (1), poindre (1), pocher (1), passé (1), passe (1), nuancer (1), nombre (1), né (1), naturel (1),
nature (1), naissance (1), mise (1), mentir (1), mèche (1), maximum (1), marrer (1), malgré (1), maintenir (1),
légèrement (1), justement (1), juneaux (1), isoler (1), inverser (1), interroger (1), intellectuel (1), incroyable (1),
impressionner (1), goutter (1), génial (1), fusionnelles (1), forcément (1), force (1), fausser (1), fasciner (1), facile
(1), expliquer (1), évider (1), énormément (1), ennuyer (1), ennuyé (1), enchaîner (1), empêché (1), école (1),
différencier (1), derrière (1), dépendre (1), départir (1), début (1), côtoyer (1), copier (1), connaissance (1),
commun (1), coiffure (1), cœur (1), choisi (1), choc (1), césarienne (1), caché (1), bureau (1), baser (1), aventurer
(1), autour (1), assise (1), arrangeant (1), apprécier (1), ailleurs (1), abord (1) |
|
|
A few of these are inflected forms of our 400 words. Sometimes those inflections would be obvious even to a
novice; other times there's a huge difference between the inflected and the base forms, and a novice would need
to learn them separately. But overall, these words fall into two categories: (1) words which are specific to this
conversation, and (2) perfectly ordinary words which don't fall into the top 400.
Now, if you were a beginning French student, you could repair this conversation:
1. You could ask for words to be defined, try pantomime, etc.
2. You could butcher the grammar and the pronunciation, and say "Pardon?" every 5 seconds. This will cause
most native speakers to take pity on you and explain everything with really simple words and hand gestures.
Ironically, having an excellent accent and a total mastery of your 400 words would probably make the situation
worse, because a good accent and fluid speech will cause native speakers to speed up massively and cut you
much less slack. Instead of thinking that you're a foreigner learning French, they'll tend to assume that you're
stupid or uncooporative.
3. You could adjust your 400-word list to be based on your personal needs, and not a onfrequency list. But
remember, for every word like sœur "sister" that you add to your 400, you've got to remove a word that's
already there.
4. You could learn 10 or 20 new words before each conversation to fill in the most glaring holes.
If you combine these solutions, you could actually get pretty far with the top 400 words, a lot of pantomime, and
a short cram session before each conversation. In other words, it looks like you really can speak very early if
that's how you like to approach things. But at the same time, you can also see the limits of such a tiny
vocabulary: You miss an alarming amount of the typical conversation. |
|
|
We've had this discussion many times before, but I think it's worth repeating. I'm really sincere when I say that I
agree to a point with emk. If you take the first 400 words from the French film subtitle dataset, you will not be
able to understand or participate in a conversation that has only around 130 words because many of the words in
the conversation are not in the 400-word list. If you learn only that list, you are learning probably over 300
words for nothing.
As a learner of French, you would be ill-advised to learn the French film 400-word list. I would recommend that
you learn the 130 words of this conversation. They would be much more useful.
Well, if 400 words aren't enough to understand this 130-word vocabulary, how many do you need? emk could
best give this answer. If I understand his methodology correctly, you must lookup the unknown words in the
frequency list and add up all the words leading up to the unknown words. So, for example, if the last unknown
word jumelle is number 2000, you need 2000 words to participate in this conversation that only has 130
words. You have to learn 1870 for nothing.
This is where we disagree. I say that to have this conversation, I only have to know 130 words, the words that are
present. Why should I learn 1870 words for nothing to use only 130?
The France Bienvenue website has dozens of conversations of less than 300 words each. How many words do you
need to participate in all the conversations. Thousands. How many do you need to participate in the conversation
in question here? 130.
Let me take an example in English. Here is a sentence from the article How the body recognizes viruses we
saw earlier?
My work is actually looking at the atomic level, so it's very, very tiny scales, and looking at how those molecules
interact together to produce a good immune response.
How many words are necessary to understand this sentence. I say around 28 words. Hold on. If you take the 500
most common words in written English, will you find all these 28 words? Most likely not. Let's take the 5000 most
common words. You still might not find atomic and immune. Maybe at the 15000 word level you find
all the words of this sentence. Does this mean that you need to know 15000 words to understand the 28 words
in this sentence?
What we see is that many people use only very small vocabularies. This is my position. You can have a
sophisticated technical conversation with 300 words. You can not understand or discuss a wide range of topics
with 300 words.
We will see how this works when looking at the B1 speaking exam.
1 person has voted this message useful
| s_allard Triglot Senior Member Canada Joined 5428 days ago 2704 posts - 5425 votes Speaks: French*, English, Spanish Studies: Polish
| Message 238 of 309 22 September 2014 at 4:22am | IP Logged |
emk wrote:
I know we've beaten the whole "Can you take the DELF B1 with a 300-word vocabulary" question
into the ground. :-) And I usually try not to reply to my own posts. But now that I have the software to simulate a
B1 exam with limited vocabulary, I thought it would be fun to try.
We're going to tackle reading comprehension. First, let's give our student a fighting chance, and replace the
movie frequency list with one derived from books:
... |
|
|
This is going to be short. I agree wholeheartedly here with emk. I certainly don't think that one could pass the B1
reading comprehension exam with a productive vocabulary of 300 unique words. I have never claimed that.
But just let me remind readers that I have stated and stand by my position that one could pass and even ace the
B1 oral production test with a vocabulary of 300 distinct words. When emk gets around to that, we'll certainly get
into greater detail.
Edited by s_allard on 22 September 2014 at 4:44am
1 person has voted this message useful
| Serpent Octoglot Senior Member Russian Federation serpent-849.livejour Joined 6595 days ago 9753 posts - 15779 votes 4 sounds Speaks: Russian*, English, FinnishC1, Latin, German, Italian, Spanish, Portuguese Studies: Danish, Romanian, Polish, Belarusian, Ukrainian, Croatian, Slovenian, Catalan, Czech, Galician, Dutch, Swedish
| Message 239 of 309 22 September 2014 at 5:11am | IP Logged |
s_allard wrote:
So, for example, if the last unknown word jumelle is number 2000, you need 2000 words to participate in this conversation that only has 130 words. You have to learn 1870 for nothing. |
|
|
Not for nothing - for other equally useful conversations. I'm by no means advocating blindly following a frequency list, but as long as the corpus matches your needs, you WILL find most words from it useful, at least for comprehension.
Anyway, emk does provide a clear methodology for choosing the words to focus on. What alternative are you suggesting exactly? And do you think your method (?) is usable without a teacher?
7 persons have voted this message useful
| s_allard Triglot Senior Member Canada Joined 5428 days ago 2704 posts - 5425 votes Speaks: French*, English, Spanish Studies: Polish
| Message 240 of 309 22 September 2014 at 5:36am | IP Logged |
While waiting to look at how to ace the B1 speaking exam with 300 unique words, I want to have a look at how to
calculate the number of words necessary to pass the C2 speaking exam. At this highest level of CEFR proficiency,
everything is very demanding. There is no doubt that the receptive vocabulary must be vast. I have no idea of a
figure. I'll leave that to emk. What interests me more is the productive vocabulary where the candidate is
required to speak.
One starting point is to look at the test itself. The DALF C2 French test is in three parts. The actual interaction
time with the examiner is only 30 minutes but there is about 90 minutes of listening and preparation time. I'll
look at just one of the three parts. The candidate must debate a topic for 10 minutes with the examiner.
How many words are needed for a 10 minute debate? And what would it take to easily pass the exam? What are
the examiners looking for? Since I covered this stuff many times before, I'll just say that at this level, the
candidate must exhibit total control over the language and virtually no mistakes.
How much productive vocabulary is required to do this? I recognize of course that the candidate can talk about a
whole variety of topics, but how many are required to talk about the topic at hand? If I say around 300-400, it's
not just picking a figure out of thin air. I'm basing this figure on looking at recordings of discussions between
native speakers on specific topics and what I would use in a seminar at the university. And, I'm not talking about
the first 300 or 400 words of the French film subtitle frequency list. I'm talking about 300-400 words on the
topic. That's a lot of specialized words.
Given those 300-400 words, how do I demonstrate my control over the language. Again, I feel that I'm repeating
things I've said a gazillion times. What are some the things that at great speaker of French can do with a given set
of words? Here's a short list:
1. Use a range of prefixes like re, dé, sous, im, il, in, poly, etc. to modify the meaning of a word. One can get
very creative with prefixes sur and super.
2. Use the vast number of suffixes to modify categories of words and introduce nuances of meaning. I can take
the verb jeter and make the adjective jetable. And then in the heat of the discussion speak of jetabiliité which
doesn't really exist in my dictionary but could be perfectly acceptable because it is formed just like acceptabiliité.
Another useful suffix is -isme to create abstract nouns. You could take adjectif and make adjectivisme.
3. Extensive use of idiomatic expressions. Things like à bras ouverts, tirer par les cheveux, ne pas savoir sur quel
pied danser among very many demonstrate good command of vocabulary.
4. Use advanced grammatical constructions to render nuances.
5. Make puns and plays on words that sound the same (homophones)
6. Make good use of connector words like the prepositions. For example, show that you know the distinction
between à cause de and grâce à.
7. Play with the grammatical gender of nouns that may be written the same but have different genders.
There are so many ways to demonstrate linguistic virtuosity And all that fluently and with no mistakes.
1 person has voted this message useful
|
You cannot post new topics in this forum - You cannot reply to topics in this forum - You cannot delete your posts in this forum You cannot edit your posts in this forum - You cannot create polls in this forum - You cannot vote in polls in this forum
This page was generated in 0.4219 seconds.
DHTML Menu By Milonic JavaScript
|