05-12-2020, 12:20 AM
(04-12-2020, 06:30 PM)fablelionsilencieux link a écrit :Ben dis donc ! :o
Merci [member=27]bech[/member] de l'explication, je m'endormirai moins bête ce soir.
Des bizous (caractères et octets de ton choix)
Tu resteras lion tout de même ?
(04-12-2020, 08:35 PM)Louklouk link a écrit :Ohé !
Cela signifie-t-il que plus il y a d'accents, plus cela compte de "caractères" ?
Bien évidemment, les octets ne sont pas convertibles en caractères (ou l'inverse) selon un taux de change fixe ?...
Exactement.
(04-12-2020, 09:45 PM)lelivredejeremie link a écrit :Avec les alphabets/idéogrammes asiatiques, sud-ouest-asiatiques, arabe, hébreu, etc... on doit être à 128.000 caractères, là ! Je veux dire, le monde civilisé, hein ! (....)
Mais je ne veux pas entretenir le débat, tout intéressant qu'il soit
Les combinaisons d'octets de l'encodage UTF-8 permettent d'avoir
- 128 caractères sur un octet
- 1 920 caractères codés sur 2 octets
- 63 488 caractères codés sur 3 octets
- 720 896 caractères codés sur 4 octets (en s'arrêtant en chemin)
soit au total 3 x 64 x 64 x 64 = 786 432 caractères possibles, mais on aurait pu aller jusqu'à 2 097 152 caractères (8 x 64[sup]3[/sup]).
Et si en poursuivant selon la même logique, on générait des codes UTF-8 jusqu'à des séquences de 8 octets, ça ferait 64[sup]7[/sup] possibilités soit 4 398 046 511 104 caractères.