Update language search index

Incorporates local language names that were recently added
to the CLDR extension.

Also remove a test case for "tonga". It checks a disambiguation
that will be done differently starting from
I2c09d409567efef2e0498cde15ecead4c438c657

The test will be restored in a subsequent patch
with a different language name.

Bug: T374785
Depends-On: I9b5b7aa91532eee0a1ff6ab868b3cb5f95c4590b
Change-Id: I62f6c9da90074258f13b7fb281e777b3bcf5d17d
This commit is contained in:
Amir E. Aharoni
2024-09-30 18:01:26 -04:00
committed by jenkins-bot
parent dde135b334
commit e9165cc37d
3 changed files with 72 additions and 18 deletions

View File

@@ -125,8 +125,6 @@ class LanguageNameIndexer extends Maintenance {
'pnb' => [ 'punjabi western' ],
// Tai Nuea (T367377)
'tdd' => [ 'ᥖᥭᥰᥖᥬᥳᥑᥨᥒᥰ' ],
// Chitonga (T368856)
'toi' => [ 'tonga, chi-' ],
// Waale (T368046) - support alternate spellings of the name
'wlx' => [ 'waali', 'waalii' ],
// Simplified and Traditional Chinese, because zh-hans and zh-hant

View File

@@ -378,6 +378,7 @@ class LanguageNameSearchData {
'agèm' => 'agq',
'agẽ' => 'agq',
'ahem dili' => 'agq',
'ahirani' => 'ahr',
'ahitūriana' => 'ast',
'ahl äjiptesch' => 'egy',
'ahl änglesch' => 'ang',
@@ -635,6 +636,7 @@ class LanguageNameSearchData {
'aleouteg' => 'ale',
'aleucki' => 'ale',
'aleut' => 'ale',
'aleut (cyrillic script)' => 'ale-cyrl',
'aleut dili' => 'ale',
'aleuta' => 'ale',
'aleutais' => 'ale',
@@ -2096,6 +2098,7 @@ class LanguageNameSearchData {
'alta — alemán de la alta edad antigua' => 'goh',
'altai — isi-southern altai' => 'alt',
'altai — južni altai' => 'alt',
'altai — northern altai' => 'atv',
'altai — saútán altai lángwej' => 'alt',
'altai — southern altai' => 'alt',
'altai — suður altai' => 'alt',
@@ -3084,6 +3087,7 @@ class LanguageNameSearchData {
'beleruusiyaan' => 'be',
'belgialaš hollánddagiella' => 'nl-be',
'belin' => 'byn',
'belize kriol' => 'bzj',
'belizisk kreol' => 'bzj',
'beloetsji' => 'bal',
'belorusa' => 'be',
@@ -3424,6 +3428,7 @@ class LanguageNameSearchData {
'bokmål na nirribhidh' => 'nb',
'bokmål norueguês' => 'nb',
'bokmål norwegia' => 'nb',
'bole' => 'bol',
'bolgar' => 'bg',
'bolgar dili' => 'bg',
'bolgarščina' => 'bg',
@@ -3653,6 +3658,7 @@ class LanguageNameSearchData {
'buginera' => 'bug',
'buginesanci' => 'bug',
'buginese' => 'bug',
'buginese (buginese script)' => 'bug-bugi',
'buginesesch' => 'bug',
'buginesisch' => 'bug',
'buginesisk' => 'bug',
@@ -3734,6 +3740,7 @@ class LanguageNameSearchData {
'bunun' => 'bnn',
'bununi' => 'bnn',
'bura' => 'bwr',
'bura-pabir' => 'bwr',
'burejahtesch' => 'bua',
'buretananci' => 'br',
'burgao' => 'bg',
@@ -7042,6 +7049,7 @@ class LanguageNameSearchData {
'ekayuki' => 'eka',
'ekaĝuka' => 'eka',
'ekkert tungumálaefni' => 'zxx',
'ekpeye' => 'ekp',
'ekstremadura dili' => 'ext',
'ekstremaduransk' => 'ext',
'elaamsch' => 'elx',
@@ -7872,6 +7880,7 @@ class LanguageNameSearchData {
'fiji' => 'fj',
'fiji dili' => 'fj',
'fiji hindi' => 'hif-latn',
'fiji hindi (devanagari script)' => 'hif-deva',
'fiji hindi (latin script)' => 'hif-latn',
'fiji hintçesi' => 'hif',
'fiji-hindi' => 'hif',
@@ -10952,6 +10961,7 @@ class LanguageNameSearchData {
'hulandes (be)' => 'nl-be',
'huluníixsuwaakan' => 'umu',
'hunanīhi' => 'su',
'hunde' => 'hke',
'hungaari senni' => 'hu',
'hungara' => 'hu',
'hungareg' => 'hu',
@@ -11169,6 +11179,7 @@ class LanguageNameSearchData {
'hindi — fidži hindi (ladina kiri)' => 'hif-latn',
'hindi — fidžio hindi' => 'hif',
'hindi — fiji hindi' => 'hif-latn',
'hindi — fiji hindi (devanagari script)' => 'hif-deva',
'hindi — fiji hindi (latin script)' => 'hif-latn',
'hindi — fijiansk hindi' => 'hif',
'hindi — fijiansk hindi (devanagari-alfabetet)' => 'hif-deva',
@@ -11818,6 +11829,7 @@ class LanguageNameSearchData {
'interlinqve' => 'ie',
'interlìngua' => 'ia',
'interlíngua' => 'ia',
'interslavic (cyrillic script)' => 'isv-cyrl',
'interslavic (latin script)' => 'isv-latn',
'interslawisch (lateinische schrift)' => 'isv-latn',
'intet sprogligt indhold' => 'zxx',
@@ -13115,6 +13127,7 @@ class LanguageNameSearchData {
'javanes' => 'jv',
'javanesch' => 'jv',
'javanese' => 'jv',
'javanese (javanese script)' => 'jv-java',
'javanesisk' => 'jv',
'javanesisk (javanesisk alfabet)' => 'jv-java',
'javanesiska' => 'jv',
@@ -13263,6 +13276,7 @@ class LanguageNameSearchData {
'judeo-perzijski' => 'jpr',
'judeo-perzisch' => 'jpr',
'judeo-perzysk' => 'jpr',
'judeo-tat' => 'jdt',
'judeo-árabe' => 'jrb',
'judeoarabski' => 'jrb',
'judeoarabština' => 'jrb',
@@ -16682,6 +16696,7 @@ class LanguageNameSearchData {
'krimea — turkeg krimea' => 'crh',
'krimea — turki krimea' => 'crh',
'krimmitatari — rumeenia krimmitatari' => 'crh-ro',
'kriol — belize kriol' => 'bzj',
'kriol — bileez kriol' => 'bzj',
'kriol — haítí kriol' => 'ht',
'krií — muse krií lángwej' => 'crm',
@@ -19765,6 +19780,7 @@ class LanguageNameSearchData {
'manobo' => 'mno',
'manobo jezik' => 'mno',
'manshw' => 'mnc',
'mansi' => 'mns',
'mansjú' => 'mnc',
'mansk' => 'gv',
'manska' => 'gv',
@@ -20703,6 +20719,8 @@ class LanguageNameSearchData {
'montan sorbic' => 'hsb',
'montanjų' => 'moe',
'montenegrin' => 'sr-me',
'montenegrin (cyrillic script)' => 'cnr-cyrl',
'montenegrin (latin script)' => 'cnr-latn',
'montenegrinisch' => 'cnr',
'montenegrinsk' => 'cnr',
'montenegrinsk (kyrillisk alfabet)' => 'cnr-cyrl',
@@ -22219,6 +22237,7 @@ class LanguageNameSearchData {
'norskt bókmál' => 'nb',
'norsunluurannikonkoro' => 'kfo',
'north ndebele' => 'nd',
'northern altai' => 'atv',
'northern east cree' => 'crl',
'northern frisian' => 'frr',
'northern haida' => 'hdn',
@@ -24388,6 +24407,7 @@ class LanguageNameSearchData {
'poolsk' => 'pl',
'poonpei' => 'pon',
'pooríŋ beléŋ' => 'fvr',
'popti\'' => 'jac',
'porosz' => 'prg',
'portagailis' => 'pt',
'portagailis bhraisileach' => 'pt-br',
@@ -31981,7 +32001,6 @@ class LanguageNameSearchData {
'tonga del nyasa' => 'tog',
'tonga dili' => 'to',
'tonga nyasa' => 'tog',
'tonga, chi-' => 'toi',
'tongaans' => 'to',
'tongaansk' => 'to',
'tongaasch' => 'to',
@@ -37572,6 +37591,7 @@ class LanguageNameSearchData {
'адыгейаг' => 'ady',
'адыгейская' => 'ady',
'адыгейский' => 'ady',
'адыгейский (кириллица)' => 'ady-cyrl',
'адыгейче' => 'ady',
'адыгэбзэ' => 'kbd-cyrl',
'адьырбайдьаанныы' => 'az',
@@ -37725,6 +37745,7 @@ class LanguageNameSearchData {
'алеутийн' => 'ale',
'алеутски' => 'ale',
'алеутский' => 'ale',
'алеутский (кириллица)' => 'ale-cyrl',
'алеутська' => 'ale',
'алеуттуу' => 'ale',
'алеутча' => 'ale',
@@ -38379,6 +38400,7 @@ class LanguageNameSearchData {
'белорусийн' => 'be',
'белоруски' => 'be',
'белорусский' => 'be',
'белорусский (тарашкевица)' => 'be-x-old',
'белорусӣ' => 'be',
'белуджский' => 'bal',
'белуџиски' => 'bal',
@@ -38651,6 +38673,7 @@ class LanguageNameSearchData {
'венетски' => 'vec',
'венец' => 'vec',
'венеция тілі' => 'vec',
'вепсский' => 'vep',
'вепшки' => 'vep',
'верхнелужицкий' => 'hsb',
'верхньолужицька' => 'hsb',
@@ -38662,6 +38685,7 @@ class LanguageNameSearchData {
'виру' => 'vro',
'влахесте' => 'ruq-cyrl',
'влашки' => 'rup',
'влашский цыганский' => 'rmy',
'водский' => 'vot',
'водська' => 'vot',
'волайта' => 'wal',
@@ -38694,6 +38718,7 @@ class LanguageNameSearchData {
'вунжочо' => 'vun',
'вуньо' => 'vun',
'вунџо' => 'vun',
'выруский' => 'vro',
'вырӑс' => 'ru',
'вьетнам' => 'vi',
'вьетнам тілі' => 'vi',
@@ -38814,6 +38839,7 @@ class LanguageNameSearchData {
'гонді' => 'gon',
'горнолужички' => 'hsb',
'горнолужишки' => 'hsb',
'горномарийский' => 'mrj',
'горонтало' => 'gor',
'горонтало тілі' => 'gor',
'горонталочо' => 'gor',
@@ -39057,6 +39083,7 @@ class LanguageNameSearchData {
'еврей' => 'he',
'еврейско-арабский' => 'jrb',
'еврейско-персидский' => 'jpr',
'еврейско-татский' => 'jdt',
'еврејскоарапски' => 'jrb',
'еврејскоперсиски' => 'jpr',
'европан испанхойн' => 'es-es',
@@ -39141,6 +39168,7 @@ class LanguageNameSearchData {
'западен балочи' => 'bgn',
'западен оджибва' => 'ojw',
'западен оџибва' => 'ojw',
'западноармянский' => 'hyw',
'западноканадски инуктитут' => 'ikt',
'западномариски' => 'mrj',
'западнофламански' => 'vls',
@@ -39376,6 +39404,7 @@ class LanguageNameSearchData {
'кабардин тілі' => 'kbd',
'кабардински' => 'kbd',
'кабардинский' => 'kbd',
'кабардинский (кириллица)' => 'kbd-cyrl',
'кабардинська' => 'kbd',
'кабардинче' => 'kbd',
'кабардски' => 'kbd',
@@ -39417,6 +39446,9 @@ class LanguageNameSearchData {
'казахская' => 'kk',
'казахски' => 'kk',
'казахский' => 'kk',
'казахский (арабский алфавит)' => 'kk-arab',
'казахский (кириллица)' => 'kk-cyrl',
'казахский (латинский алфавит)' => 'kk-latn',
'казахська' => 'kk',
'казашки' => 'kk',
'каинганг' => 'kgp',
@@ -39614,6 +39646,7 @@ class LanguageNameSearchData {
'кикуюү' => 'ki',
'кикују' => 'ki',
'килсславянийн' => 'cu',
'кильдинский саамский' => 'sjd',
'кимбунду' => 'kmb',
'кимбунду тілі' => 'kmb',
'кимбундуча' => 'kmb',
@@ -39916,6 +39949,7 @@ class LanguageNameSearchData {
'канадагӣ — франсузии канадагӣ' => 'fr-ca',
'канадалық — батыс канадалық инуктитут тілі' => 'ikt',
'канадын — баруун канадын инуктитут' => 'ikt',
'карельский — ливвиковский карельский' => 'olo',
'келтски — шотландски келтски' => 'gd',
'кель — абхазонь кель' => 'ab',
'кель — австралиянь англонь кель' => 'en-au',
@@ -40060,6 +40094,7 @@ class LanguageNameSearchData {
'лакотачалакотача' => 'lkt',
'лакотски' => 'lkt',
'лакоцкая' => 'lkt',
'лакский' => 'lbe',
'лакхара сербийн' => 'hsb',
'ламастан цийн' => 'zh-hant',
'ламба' => 'lam',
@@ -40088,6 +40123,7 @@ class LanguageNameSearchData {
'латвиски' => 'lv',
'латві́йскїй' => 'lv',
'латгалски' => 'ltg',
'латгальский' => 'ltg',
'латин' => 'la',
'латинаг' => 'la',
'латинаг америкаг англисаг' => 'es-419',
@@ -40131,6 +40167,7 @@ class LanguageNameSearchData {
'лезгінська' => 'lez',
'лекъаг' => 'lez',
'летувіская' => 'lt',
'ливвиковский карельский' => 'olo',
'ливонски' => 'liv',
'лигур тілі' => 'lij',
'лигури' => 'lij',
@@ -40188,6 +40225,7 @@ class LanguageNameSearchData {
'луба-лулуа' => 'lua',
'луба-лулуа тілі' => 'lua',
'луба-лулуача' => 'lua',
'луговомарийский' => 'mhr',
'луизиана креоле' => 'lou',
'луизиана креолчо' => 'lou',
'луизиански креолски' => 'lou',
@@ -40431,6 +40469,7 @@ class LanguageNameSearchData {
'манипурӣ' => 'mni',
'манкс' => 'gv',
'манкски' => 'gv',
'мансийский' => 'mns',
'манчжурська' => 'mnc',
'маньчжурский' => 'mnc',
'маніпурі' => 'mni',
@@ -40504,6 +40543,7 @@ class LanguageNameSearchData {
'мақдунӣ' => 'mk',
'маҷорӣ' => 'hu',
'мегрелски' => 'xmf',
'мегрельский' => 'xmf',
'меджусловјанскы' => 'isv-cyrl',
'медумба' => 'byv',
'мейтэй' => 'mni',
@@ -40675,6 +40715,7 @@ class LanguageNameSearchData {
'мова — штучная мова' => 'art',
'моваў — некалькі моваў' => 'mul',
'мовного — без мовного вмісту' => 'zxx',
'монгольский — периферийный монгольский' => 'mvf',
'мотт — боьвзуш боцу мотт' => 'und',
'моту — хири моту' => 'ho',
'моў — некалькі моў' => 'mul',
@@ -40698,6 +40739,7 @@ class LanguageNameSearchData {
'нама тілі' => 'naq',
'намача' => 'naq',
'намская' => 'naq',
'нанайский' => 'gld',
'нарвежская' => 'no',
'нарвежская (букмол)' => 'nb',
'нарвежская (нюношк)' => 'nn',
@@ -40773,6 +40815,7 @@ class LanguageNameSearchData {
'неміс тілі' => 'de',
'неміс тілі (швейцария)' => 'gsw',
'ненгату' => 'yrl',
'ненецкий' => 'yrk',
'ненэцяʼ вада' => 'yrk',
'неополитанча' => 'nap',
'непал тілі' => 'ne',
@@ -41151,6 +41194,7 @@ class LanguageNameSearchData {
'пенсилваниски германски' => 'pdc',
'пенџапски' => 'pa',
'перем коми' => 'koi',
'периферийный монгольский' => 'mvf',
'перс' => 'fa',
'персайнаг' => 'fa',
'персидский' => 'fa',
@@ -41167,6 +41211,7 @@ class LanguageNameSearchData {
'пииннии' => 'fi',
'пикардски' => 'pcd',
'пилипииннии' => 'fil',
'пите-саамский' => 'sje',
'пиэристии' => 'fa',
'пиџин' => 'pis',
'плейнс крий' => 'crk',
@@ -41187,6 +41232,7 @@ class LanguageNameSearchData {
'понапе' => 'pon',
'понапеан' => 'pon',
'понпејски' => 'pon',
'понтийский' => 'pnt',
'понтски' => 'pnt',
'портога́льскїй' => 'pt',
'португааллыы' => 'pt',
@@ -41374,12 +41420,14 @@ class LanguageNameSearchData {
'рунді' => 'rn',
'рус' => 'ru',
'русински' => 'rue',
'русинский' => 'rue',
'русиньскый' => 'rue',
'руская' => 'ru',
'руски' => 'rsk',
'русский' => 'ru',
'русча' => 'ru',
'русӣ' => 'ru',
'рутульский' => 'rut',
'рэтараманская' => 'rm',
'рівнинна крі' => 'crk',
'рꙋ́сскїй' => 'ru',
@@ -41400,6 +41448,7 @@ class LanguageNameSearchData {
'саамія' => 'lsm',
'саксонь кяль' => 'de',
'саламонскі піджын' => 'pis',
'саларский' => 'slr',
'салишки (северен теснец)' => 'str',
'саліська стрейт' => 'str',
'самалі' => 'so',
@@ -41506,6 +41555,7 @@ class LanguageNameSearchData {
'северен сото' => 'nso',
'северен тучоне' => 'ttm',
'северен фризийски' => 'frr',
'северноалтайский' => 'atv',
'севернолуриски' => 'lrc',
'севернолурский' => 'lrc',
'северносаамски' => 'se',
@@ -41548,7 +41598,11 @@ class LanguageNameSearchData {
'сербскахарвацкая' => 'sh',
'сербская' => 'sr',
'сербский' => 'sr',
'сербский (кириллица)' => 'sr-cyrl',
'сербский (латинский алфавит)' => 'sr-latn',
'сербскохорватский' => 'sh',
'сербскохорватский (кириллица)' => 'sh-cyrl',
'сербскохорватский (латинский алфавит)' => 'sh-latn',
'сербська' => 'sr',
'сербсько-хорватська' => 'sh',
'сербча' => 'sr',
@@ -41567,11 +41621,13 @@ class LanguageNameSearchData {
'сесото' => 'st',
'сесоточо' => 'st',
'сесута' => 'st',
'сибирскотатарский' => 'sty',
'сидама' => 'sid',
'сидамо' => 'sid',
'сиксика' => 'bla',
'сиксика тілі' => 'bla',
'сиксикача' => 'bla',
'силезский' => 'szl',
'сингал' => 'si',
'сингал тілі' => 'si',
'сингалача' => 'si',
@@ -41842,6 +41898,7 @@ class LanguageNameSearchData {
'саамиче — сколт саамиче' => 'sms',
'саамиче — түндүк саамиче' => 'se',
'саамиче — түштүк саамиче' => 'sma',
'саамский — кильдинский саамский' => 'sjd',
'саамча — жанубий саамча' => 'sma',
'саамча — шимолий саамча' => 'se',
'саксон — төменгі саксон тілі' => 'nds-nl',
@@ -41937,6 +41994,8 @@ class LanguageNameSearchData {
'таджикийн' => 'tg',
'таджикски' => 'tg',
'таджикский' => 'tg',
'таджикский (кириллица)' => 'tg-cyrl',
'таджикский (латинский алфавит)' => 'tg-latn',
'таджицька' => 'tg',
'таджыкская' => 'tg',
'таджыцкая' => 'tg',
@@ -41971,6 +42030,7 @@ class LanguageNameSearchData {
'талтан' => 'tht',
'талтански' => 'tht',
'талтанча (индей тили)' => 'tht',
'талышский' => 'tly',
'тальтан' => 'tht',
'тальтан тілі' => 'tht',
'тамазайти атласи марказӣ' => 'tzm',
@@ -42008,6 +42068,8 @@ class LanguageNameSearchData {
'татарская (лацініца)' => 'tt-latn',
'татарски' => 'tt',
'татарский' => 'tt',
'татарский (кириллица)' => 'tt-cyrl',
'татарский (латинский алфавит)' => 'tt-latn',
'татарська' => 'tt',
'татарча' => 'tt-cyrl',
'татарча / tatarça' => 'tt',
@@ -42755,6 +42817,8 @@ class LanguageNameSearchData {
'узбекская' => 'uz',
'узбекски' => 'uz',
'узбекский' => 'uz',
'узбекский (кириллица)' => 'uz-cyrl',
'узбекский (латинский алфавит)' => 'uz-latn',
'узбецька' => 'uz',
'узбечки' => 'uz',
'узбэцкая' => 'uz',
@@ -42764,6 +42828,8 @@ class LanguageNameSearchData {
'уйгурская' => 'ug',
'уйгурски' => 'ug',
'уйгурский' => 'ug',
'уйгурский (арабский алфавит)' => 'ug-arab',
'уйгурский (латинский алфавит)' => 'ug-latn',
'уйгурська' => 'ug',
'уйгурча' => 'ug',
'уйгуурдуу' => 'ug',
@@ -42786,6 +42852,7 @@ class LanguageNameSearchData {
'умбунду' => 'umb',
'умбунду тілі' => 'umb',
'умбундуча' => 'umb',
'уме-саамский' => 'sju',
'унаӈам тунуу' => 'ale-cyrl',
'унгарски' => 'hu',
'уоллайтта' => 'wal',
@@ -43118,6 +43185,7 @@ class LanguageNameSearchData {
'цаконски' => 'tsd',
'царкоўнаславянская' => 'cu',
'цахурски' => 'tkr',
'цахурский' => 'tkr',
'цвана' => 'tn',
'централен оджибва' => 'ojc',
'централен оџибва' => 'ojc',
@@ -43153,6 +43221,7 @@ class LanguageNameSearchData {
'infix' => [
'цийн — атта цийн' => 'zh-hans',
'цийн — ламастан цийн' => 'zh-hant',
'цыганский — влашский цыганский' => 'rmy',
],
],
1095 => [
@@ -43481,6 +43550,7 @@ class LanguageNameSearchData {
'южноалтайский' => 'alt',
'южнокурдский' => 'sdh',
'южнокюрдски' => 'sdh',
'южнорусинский' => 'rsk',
'южносаамски' => 'sma',
'южносаамский' => 'sma',
'южный лушуцид' => 'slh',
@@ -45179,6 +45249,7 @@ class LanguageNameSearchData {
'מאיין' => 'mye',
'מאנגאליש' => 'mn',
'מאנית' => 'gv',
'מאנסי' => 'mns',
'מאפאה' => 'maf',
'מאקאמה' => 'jmc',
'מאקוואה מטו' => 'mgh',