Spaces:
				
			
			
	
			
			
					
		Running
		
	
	
	
			
			
	
	
	
	
		
		
					
		Running
		
	| mappings = [ | |
| ["«", '"'], | |
| ["»", '"'], | |
| # 0. словарик | |
| # алейкум | |
| ["алейкум", "aleyküm"], | |
| # бейуде | |
| ["бейуде", "beyüde"], | |
| # большевик | |
| ["большевик", "bolşevik"], | |
| # борнен | |
| ["борнен", "bornen"], | |
| # бугунь | |
| ["([\s\"'\(\)\-.,:;!?>\]])бугун", r"\1bugün"], | |
| # бузкесен | |
| ["бузкесен", "buzkesen"], | |
| # буксир | |
| ["буксир", "buksir"], | |
| # бульбуль | |
| ["бульбуль", "bülbül"], | |
| # бульвар | |
| ["бульвар", "bulvar"], | |
| # бульдозер | |
| ["бульдозер", "buldozer"], | |
| # бульон | |
| ["бульон", "bulyon"], | |
| # бунен | |
| ["бунен", "bunen"], | |
| ["буннен", "bunnen"], | |
| # бус-бутюн | |
| ["бус-бутюн", "büs-bütün"], | |
| # бутерброд | |
| ["бутерброд", "buterbrod"], | |
| # буфер и буфет | |
| ["буфе([рт])", "bufe\1"], | |
| # буюк | |
| ["буюк([^ъ])", "büyük\1"], | |
| # формы глагола буюмек | |
| ["бую([гдйлмнпрстчшc])(и)", "büyü\1\2"], | |
| # буюп | |
| ["([\s\"'\(\)\-.,:;!?>\]])буюп([\s\"'.,:;!?\)\-\[<])", r"\1büyüp\2"], | |
| # буют | |
| ["буют([^ыа])", "büyüt\1"], | |
| # гонъюль | |
| ["гонъюл", "göñül"], | |
| # горизонт | |
| ["горизонт", "gorizont"], | |
| # госпиталь | |
| ["госпиталь", "gospital"], | |
| # гунях | |
| ["гунях", "günâh"], | |
| # гуна | |
| ["гуна", "güna"], | |
| # гургуль | |
| ["гургуль", "gürgül"], | |
| # гуя | |
| ["гуя", "güya"], | |
| # ёлнен | |
| ["ёлнен", "yolnen"], | |
| # зумбуль | |
| ["зумбуль", "zümbül"], | |
| # кодекс | |
| ["кодекс", "kodeks"], | |
| # кодификация и однокоренные | |
| ["кодифик", "kodifik"], | |
| # козь | |
| ["козь([^я])", "köz\1"], | |
| # кой | |
| ["кой([\s\"'.,:;!?\)\-\[<])", "köy\1"], | |
| ["койнинъ([\s\"'.,:;!?\)\-\[<])", "köyniñ\1"], | |
| ["койни([\s\"'.,:;!?\)\-\[<])", "köyni\1"], | |
| ["койге([\s\"'.,:;!?\)\-\[<])", "köyge\1"], | |
| ["койде([\s\"'.,:;!?\)\-\[<])", "köyde\1"], | |
| ["койдеки([\s\"'.,:;!?\)\-\[<])", "köydeki\1"], | |
| ["койден([\s\"'.,:;!?\)\-\[<])", "köyden\1"], | |
| ["койлю", "köylü"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])кою", r"\1köyü"], | |
| # ком-кок | |
| ["([\s\"'\(\)\-.,:;!?>\]])ком-кок", r"\1köm-kök"], | |
| # кок | |
| ["([\s\"'\(\)\-.,:;!?>\]])кок([^еёюяЕЁЮЯ])", r"\1kök\2"], | |
| # кокос | |
| ["кокос", "kokos"], | |
| # коллега и однокоренные | |
| ["коллег", "kolleg"], | |
| ["коллега", "kollega"], | |
| # коллекция, коллектив и однокоренные | |
| ["коллек([цт])", "kollek\1"], | |
| # комбинат и однокоренные | |
| ["комбин", "kombin"], | |
| # комедия | |
| ["комедия", "komediya"], | |
| # комендант и однокоренные | |
| ["коменда", "komenda"], | |
| # комета | |
| ["комета", "kometa"], | |
| # комиссия, комитет | |
| ["коми([ст])", "komi\1"], | |
| # комментарий и однокоренные | |
| ["коммент", "komment"], | |
| # коммерция и коммерсант | |
| ["коммер([сц])", "kommer\1"], | |
| # компенсация и однокоренные | |
| ["компенс", "kompens"], | |
| # компиляция и однокоренные | |
| ["компил", "kompil"], | |
| # компьютер | |
| ["компьютер", "kompyuter"], | |
| # конвейер | |
| ["конвейер", "konveyer"], | |
| # конвенция и однокоренные | |
| ["конвен", "konven"], | |
| # конверт | |
| ["конверт", "konvert"], | |
| # конденсатор и однокоренные | |
| ["конденс", "kondens"], | |
| # кондитер | |
| ["кондитер", "konditer"], | |
| # коник (конический) | |
| ["коник", "konik"], | |
| # консер | |
| ["консерв", "konserv"], | |
| # контейнер | |
| ["контейнер", "konteyner"], | |
| # континент | |
| ["континент", "kontinent"], | |
| # конференция, конфет | |
| ["конфе", "konfe"], | |
| # конфискация и однокоренные | |
| ["конфискац", "konfiskats"], | |
| # концентрация и однокоренные | |
| ["концен", "kontsen"], | |
| # концерт | |
| ["концерт", "kontsert"], | |
| # коньки | |
| ["коньки", "konki"], | |
| # коньки | |
| ["коньяк", "konyak"], | |
| # конъюктура | |
| ["конъюктур", "konyuktur"], | |
| # копирлемек и однокоренные | |
| ["копирле", "kopirle"], | |
| # копия | |
| ["копия", "kopiya"], | |
| # коп | |
| ["([\s\"'\(\)\-.,:;!?>\]])коп([^еёюяЕЁЮЯ])", r"\1köp\2"], | |
| # корея | |
| ["корея", "koreya"], | |
| # корректор, корреспондент | |
| ["корре", "korre"], | |
| # коридор | |
| ["коридор", "koridor"], | |
| # косметика | |
| ["косме", "kosme"], | |
| # костюм | |
| ["костюм", "kostüm"], | |
| # космик (космический) | |
| ["космик", "kosmik"], | |
| # котировка | |
| ["котировка", "kotirovka"], | |
| # котлет | |
| ["котлет", "kotlet"], | |
| # коше | |
| ["коше", "köşe"], | |
| # куе | |
| ["([\s\"'\(\)\-.,:;!?>\]])куе", r"\1küye"], | |
| # кулинар | |
| ["кулинар", "kulinar"], | |
| # кульминация | |
| ["кульминац", "kulminats"], | |
| # культивация | |
| ["культив", "kultiv"], | |
| # культура | |
| ["культура", "kultura"], | |
| # курьк | |
| ["([\s\"'\(\)\-.,:;!?>\]])курк([\s\"'.,:;!?\)\-\[<])", r"\1kürk\2"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куркке", r"\1kürkke"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куркни", r"\1kürkni"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куркте", r"\1kürkte"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куркчи", r"\1kürkçi"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куркчю", r"\1kürkçü"], | |
| # курсив | |
| ["курсив", "kursiv"], | |
| # кушкулемек и однокоренные | |
| ["кушку", "küşkü"], | |
| # куюк | |
| ["куюк", "küyük"], | |
| # медьюн | |
| ["медьюн", "medyun"], | |
| # месуль | |
| ["месуль", "mesül"], | |
| ["месули", "mesüli"], | |
| # мефкуре | |
| ["мефкуре", "mefküre"], | |
| # могедек | |
| ["могедек", "mögedek"], | |
| # муурь | |
| ["муур", "müür"], | |
| # муче | |
| ["муче", "müçe"], | |
| # муюз | |
| ["муюз", "müyüz"], | |
| # нумюне | |
| ["нумюне", "nümüne"], | |
| # ог | |
| ['(["\s(-])ог([^ъ])', r"\1öг\2"], | |
| # одеколон | |
| ["одеколон", "odekolon"], | |
| # океан | |
| ["океан", "okean"], | |
| # …ольчер | |
| ["ольчер", "ölçer"], | |
| # олимп | |
| ["олимп", "olimp"], | |
| # онен | |
| ["онен", "onen"], | |
| ["оннен", "onnen"], | |
| # операция и однокоренные | |
| ["опера", "opera"], | |
| # опция и однокоренные | |
| ["опция", "optsiya"], | |
| ["опци", "optsi"], | |
| # орден и ордер | |
| ["([\s\"'\(\)\-.,:;!?>\]])орде([нр])", r"\1orde\2"], | |
| # оригинал | |
| ["оригинал", "original"], | |
| # ориентир | |
| ["ориент", "oriyent"], | |
| # оркестр | |
| ["оркестр", "orkestr"], | |
| # офис | |
| ["офис", "ofis"], | |
| # офицер | |
| ["офицер", "ofitser"], | |
| # офсет | |
| ["офсет", "ofset"], | |
| # оюннен | |
| ["оюннен", "oyunnen"], | |
| # публикация и однокоренные | |
| ["публик", "publik"], | |
| # публицистика и однокоренные | |
| ["публиц", "publits"], | |
| # сурет | |
| ["сурет", "süret"], | |
| # ультиматум и однокоренные | |
| ["ультимат", "ultimat"], | |
| # ультра | |
| ["ультра", "ultra"], | |
| # уника | |
| ["([\s\"'\(\)\-.,:;!?>\]])уник", r"\1unik"], | |
| # универcаль, универмаг, университет | |
| ["универ", "univer"], | |
| # унтер | |
| ["([\s\"'\(\)\-.,:;!?>\]])унтер", r"\1unter"], | |
| # урьян | |
| ["урьян", "uryan"], | |
| # джонк | |
| ["джонкю", "cönkü"], | |
| ["джонк([^ъ])", "cönk\1"], | |
| # джуньджу | |
| ["джуньджу", "cüncü"], | |
| # шовинизм и однокоренные | |
| ["шовини", "şovini"], | |
| # шоссе | |
| ["шоссе", "şosse"], | |
| # шофёр | |
| ["шоф[её]р", "şoför"], | |
| # шунен | |
| ["шунен", "şunen"], | |
| ["шуннен", "şunnen"], | |
| # юз | |
| ["([\s\"'\(\)\-.,:;!?>\]])юз([\s\"'.,:;!?\)\-\[<])", r"\1yüz\2"], | |
| # юзбашы | |
| ["([\s\"'\(\)\-.,:;!?>\]])юзбашы", r"\1yüzbaşı"], | |
| # юзйыллыкъ | |
| ["([\s\"'\(\)\-.,:;!?>\]])юзйыл", r"\1yüzyıl"], | |
| # юк | |
| ["([\s\"'\(\)\-.,:;!?>\]])юк([^ъ])", r"\1yüк\2"], | |
| # юрип | |
| ["([\s\"'\(\)\-.,:;!?>\]])юрип", r"\1yürip"], | |
| # 3-юнджи, 4-юнджи | |
| ["([34])-юнджи", r"\1-ünci"], | |
| # некоторые глагольные формы на -ама, -алма | |
| # букама, букалма | |
| ["([\s\"'\(\)\-.,:;!?>\]])букама", r"\1bükama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])букалма", r"\1bükalma"], | |
| # комама, комалма | |
| ["([\s\"'\(\)\-.,:;!?>\]])комама", r"\1kömama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])комалма", r"\1kömalma"], | |
| # корама, коралма | |
| ["([\s\"'\(\)\-.,:;!?>\]])корама", r"\1körama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])коралма", r"\1köralma"], | |
| # кочама, кочалма | |
| ["([\s\"'\(\)\-.,:;!?>\]])кочама", r"\1köçama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])кочалма", r"\1köçalma"], | |
| # куяма, куялма | |
| ["([\s\"'\(\)\-.,:;!?>\]])куяма", r"\1küyama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куялма", r"\1küyalma"], | |
| # кулама, кулалма | |
| # [ "([\s\"'\(\)\-.,:;!?>\]])кулама", r"\1külama" ], | |
| # [ "([\s\"'\(\)\-.,:;!?>\]])кулалма", r"\1külalma" ], | |
| # кусама, кусалма | |
| ["([\s\"'\(\)\-.,:;!?>\]])кусама", r"\1küsama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])кусалма", r"\1küsalma"], | |
| # кутама, куталма | |
| ["([\s\"'\(\)\-.,:;!?>\]])кутама", r"\1kütama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])куталма", r"\1kütalma"], | |
| # опама, опалма | |
| ["([\s\"'\(\)\-.,:;!?>\]])опама", r"\1öpama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])опалма", r"\1öpalma"], | |
| # осама, осалма | |
| ["([\s\"'\(\)\-.,:;!?>\]])осама", r"\1ösama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])осалма", r"\1ösalma"], | |
| # отама, оталма | |
| # [ "([\s\"'\(\)\-.,:;!?>\]])отама", r"\1ötama" ], | |
| ["([\s\"'\(\)\-.,:;!?>\]])оталма", r"\1ötalma"], | |
| # узама, узалма | |
| # [ "([\s\"'\(\)\-.,:;!?>\]])узама", r"\1üzama" ], | |
| ["([\s\"'\(\)\-.,:;!?>\]])узалма", r"\1üzalma"], | |
| # утама, уталма | |
| ["([\s\"'\(\)\-.,:;!?>\]])утама", r"\1ütama"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])уталма", r"\1ütalma"], | |
| # Имена собственные | |
| ["аджыумер", "acıümer"], | |
| ["аджыусеин", "acıüsein"], | |
| ["боливия", "boliviya"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])ишунь", r"\1işün"], | |
| ["корбекул", "körbekül"], | |
| ["корьбекул", "körbekül"], | |
| ["куркулет", "kürkület"], | |
| ["къарагоз", "qaragöz"], | |
| ["къуртумер", "qurtümer"], | |
| ["къуртусеин", "qurtüsein"], | |
| ["марьино", "maryino"], | |
| ["одесса", "odessa"], | |
| ["одеса", "odesa"], | |
| ["потелов", "potelov"], | |
| ["пушкин", "puşkin"], | |
| ["сеитумер", "seitümer"], | |
| ["сеитусеин", "seitüsein"], | |
| ["сейитумер", "seyitümer"], | |
| ["сейитусеин", "seyitüsein"], | |
| ["щёлкино", "şçolkino"], | |
| ["эмирусеин", "emirüsein"], | |
| ["юртер", "yurter"], | |
| ["ющенко", "yuşçenko"], | |
| # -ьон | |
| ["([^\s])ьон", r"\1yon"], | |
| # Я | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])Я([\s\"'.,:;!?\)\-\[<])", | |
| r"\1Ya\2", | |
| ], # TODO: check why there is no case for small letters | |
| # Ё | |
| ["([\s\"'\(\)\-.,:;!?>\]])Ё([\s\"'.,:;!?\)\-\[<])", r"\1Yo\2"], | |
| # йе | |
| ["йе", "yye"], | |
| # йя | |
| ["йя", "yya"], | |
| # 1. буквы гъ, къ, нъ, дж | |
| ["гъ", "ğ"], | |
| ["къ", "q"], | |
| ["нъ", "ñ"], | |
| ["дж", "c"], | |
| # 2. o', u' первый заход - ё и ю после согласных | |
| [r"([бвгджзйклмнпрстфхцчшщñcБВГДЖЗЙКЛМНПРСТФХЦЧШЩÑC])ю", r"\1ü"], | |
| [r"([бвгджзйклмнпрстфхцчшщñcБВГДЖЗЙКЛМНПРСТФХЦЧШЩÑC])ё", r"\1ö"], | |
| # 3. o', u' второй заход | |
| # буква u' | |
| # ю | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёюАЫОУЕИЁЮ])ю([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])', | |
| r"\1yü\2\3\4", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"АЫОУЕИЁЮ])Ю([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮЭÜ])', | |
| r"\1YÜ\2\3\4", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"(аыоуеиёюАЫОУЕИЁЮ])ю([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])', | |
| r"\1yü\2\3", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"(АЫОУЕИЁЮ])Ю([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮЭÜ])', | |
| r"\1YÜ\2\3", | |
| ], | |
| ["ю([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])", "yü\1\2\3"], | |
| ["ю([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])", "yü\1\2"], | |
| # у и ую | |
| # после у или ую две согласных | |
| # строчная у | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПCШ])у([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
| r"\1\2ü\3\4\5", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
| r"\1ü\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])ую([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
| r"\1üyü\2\3\4", | |
| ], | |
| # заглавная У | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1\2Ü\3\4\5", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1Ü\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])Ую([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1Üyü\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])УЮ([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1ÜYÜ\2\3\4", | |
| ], | |
| # после у или ую одна согласная | |
| # строчная у | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", | |
| r"\1\2ü\3\4", | |
| ], | |
| ["([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1ü\2\3"], | |
| ["([\s\"'\(\)\-.,:;!?>\]])ую([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1üyü\2\3"], | |
| # заглавная У | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
| r"\1\2Ü\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
| r"\1Ü\2\3", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])Ую([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
| r"\1Üyü\2\3", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])УЮ([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
| r"\1ÜYÜ\2\3", | |
| ], | |
| # ещё один заход (не помню уже точно для чего он, но для чего-то нужен) | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", | |
| r"\1\2ü\3\4", | |
| ], | |
| ["([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1ü\2\3"], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
| r"\1\2Ü\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
| r"\1Ü\2\3", | |
| ], | |
| # арабские слова на муи- муэ- | |
| ["([\s\"'\(\)\-.,:;!?>\]])му([иэ])", r"\1mü\2"], | |
| # буква o' | |
| # ё | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])ё([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюü])", | |
| r"\1yö\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])Ё([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюü])", | |
| r"\1Yö\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])Ё([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮÜ])", | |
| r"\1YÖ\2\3\4", | |
| ], | |
| ["([\s\"'\(\)\-.,:;!?>\]])ё([бвгджзйклмнпрстфхцчшщcñ])([ьеёюэü])", r"\1yö\2\3"], | |
| # о | |
| # после о две согласных | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([бгкшcБГКШC])о([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
| r"\1\2ö\3\4\5", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])о([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
| r"\1ö\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1\2Ö\3\4\5", | |
| ], | |
| # после о одна согласная | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1Ö\2\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])о([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
| r"\1\2ö\3\4", | |
| ], | |
| ["([\s\"'\(\)\-.,:;!?>\]])о([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", r"\1ö\2\3"], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1\2Ö\3\4", | |
| ], | |
| [ | |
| "([\s\"'\(\)\-.,:;!?>\]])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
| r"\1Ö\2\3", | |
| ], | |
| # 4. o', u' третий заход | |
| ["([бвгджзйклмнпрстфхцчшщcñ])ю", r"\1ü"], | |
| ["([бвгджзйклмнпрстфхцчшщcñ])ё", r"\1ö"], | |
| # 5. o', u' четвёртый заход | |
| ["([ьеёюэöü])ю", r"\1yü"], | |
| # 6. буквы е и я | |
| # случаи е -> ye и я -> ya | |
| ['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüeАЫОУЕИЁЭЮЯЬЪÖÜE(])е', r"\1ye"], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüeАЫОУЕИЁЭЮЯЬЪÖÜE(])Е([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
| r"\1YE\2", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöÜeАЫОЯУЕИЁЭЮЯЬЪÖÜE(])Е([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
| r"\1Ye\2", | |
| ], | |
| ['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])я', r"\1ya"], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])Я([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
| r"\1YA\2", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])Я([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
| r"\1Ya\2", | |
| ], | |
| ['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])е', r"\1ye"], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])Е([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
| r"\1YE\2", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöÜaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])Е([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
| r"\1Ye\2", | |
| ], | |
| ['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])я', r"\1ya"], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])Я([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
| r"\1YA\2", | |
| ], | |
| [ | |
| '([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])Я([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
| r"\1Ya\2", | |
| ], | |
| # остальные вхождения е и я | |
| ["е", "e"], | |
| ["я", "â"], | |
| # 7. все оставшиеся вхождения о, у, ё, ю | |
| ["Ю([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "YU\1"], | |
| ["ю", "yu"], | |
| ["Ё([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "YO\1"], | |
| ["ё", "yo"], | |
| ["у", "u"], | |
| ["о", "o"], | |
| # 8. убираем ь и ъ | |
| ["ь", ""], | |
| ["ъ", ""], | |
| # 9. все остальные буквы | |
| # заглавные Ц и Щ | |
| ["Ц([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "TS\1"], | |
| ["Ц", "Ts"], | |
| ["Щ([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "ŞÇ\1"], | |
| ["Щ", "Şç"], | |
| # строчные | |
| ["а", "a"], | |
| ["б", "b"], | |
| ["в", "v"], | |
| ["г", "g"], | |
| ["д", "d"], | |
| ["ж", "j"], | |
| ["з", "z"], | |
| ["и", "i"], | |
| ["й", "y"], | |
| ["к", "k"], | |
| ["л", "l"], | |
| ["м", "m"], | |
| ["н", "n"], | |
| ["п", "p"], | |
| ["р", "r"], | |
| ["с", "s"], | |
| ["т", "t"], | |
| ["ф", "f"], | |
| ["х", "h"], | |
| ["ц", "ts"], | |
| ["ч", "ç"], | |
| ["ш", "ş"], | |
| ["щ", "şç"], | |
| ["ы", "ı"], | |
| ["э", "e"], | |
| ] | |
