transliterate Package¶
sinhala_transliterator
Module¶
-
class
indicnlp.transliterate.sinhala_transliterator.
SinhalaDevanagariTransliterator
[source]¶ Bases:
object
A Devanagari to Sinhala transliterator based on explicit Unicode Mapping
-
devnag_sinhala_map
= {'ऀ': 'ං', 'ँ': 'ං', 'ं': 'ං', 'ः': 'ඃ', 'ऄ': '\u0d84', 'अ': 'අ', 'आ': 'ආ', 'इ': 'ඉ', 'ई': 'ඊ', 'उ': 'උ', 'ऊ': 'ඌ', 'ऋ': 'ඍ', 'ऌ': 'ඏ', 'ऍ': 'ඈ', 'ऎ': 'එ', 'ए': 'ඒ', 'ऐ': 'ඓ', 'ऒ': 'ඔ', 'ओ': 'ඕ', 'औ': 'ඖ', 'क': 'ක', 'ख': 'ඛ', 'ग': 'ග', 'घ': 'ඝ', 'ङ': 'ඞ', 'च': 'ච', 'छ': 'ඡ', 'ज': 'ජ', 'झ': 'ඣ', 'ञ': 'ඤ', 'ट': 'ට', 'ठ': 'ඨ', 'ड': 'ඩ', 'ढ': 'ඪ', 'ण': 'ණ', 'त': 'ත', 'थ': 'ථ', 'द': 'ද', 'ध': 'ධ', 'न': 'න', 'ऩ': 'න', 'प': 'ප', 'फ': 'ඵ', 'ब': 'බ', 'भ': 'භ', 'म': 'ම', 'य': 'ය', 'र': 'ර', 'ल': 'ල', 'ळ': 'ළ', 'व': 'ව', 'श': 'ශ', 'ष': 'ෂ', 'स': 'ස', 'ह': 'හ', 'ा': 'ා', 'ि': 'ි', 'ी': 'ී', 'ु': 'ු', 'ू': 'ූ', 'ृ': 'ෘ', 'ॆ': 'ෙ', 'े': 'ේ', 'ै': 'ෛ', 'ॉ': 'ෑ', 'ॊ': 'ො', 'ो': 'ෝ', 'ौ': 'ෞ', '्': '්'}¶
-
sinhala_devnag_map
= {'ං': 'ं', 'ඃ': 'ः', '\u0d84': 'ऄ', 'අ': 'अ', 'ආ': 'आ', 'ඇ': 'ऍ', 'ඈ': 'ऍ', 'ඉ': 'इ', 'ඊ': 'ई', 'උ': 'उ', 'ඌ': 'ऊ', 'ඍ': 'ऋ', 'ඏ': 'ऌ', 'එ': 'ऎ', 'ඒ': 'ए', 'ඓ': 'ऐ', 'ඔ': 'ऒ', 'ඕ': 'ओ', 'ඖ': 'औ', 'ක': 'क', 'ඛ': 'ख', 'ග': 'ग', 'ඝ': 'घ', 'ඞ': 'ङ', 'ඟ': 'ङ', 'ච': 'च', 'ඡ': 'छ', 'ජ': 'ज', 'ඣ': 'झ', 'ඤ': 'ञ', 'ඥ': 'ञ', 'ඦ': 'ञ', 'ට': 'ट', 'ඨ': 'ठ', 'ඩ': 'ड', 'ඪ': 'ढ', 'ණ': 'ण', 'ඬ': 'ण', 'ත': 'त', 'ථ': 'थ', 'ද': 'द', 'ධ': 'ध', 'න': 'न', '\u0db2': 'न', 'ඳ': 'न', 'ප': 'प', 'ඵ': 'फ', 'බ': 'ब', 'භ': 'भ', 'ම': 'म', 'ය': 'य', 'ර': 'र', 'ල': 'ल', 'ව': 'व', 'ශ': 'श', 'ෂ': 'ष', 'ස': 'स', 'හ': 'ह', 'ළ': 'ळ', '්': '्', 'ා': 'ा', 'ැ': 'ॉ', 'ෑ': 'ॉ', 'ි': 'ि', 'ී': 'ी', 'ු': 'ु', 'ූ': 'ू', 'ෘ': 'ृ', 'ෙ': 'ॆ', 'ේ': 'े', 'ෛ': 'ै', 'ො': 'ॊ', 'ෝ': 'ो', 'ෞ': 'ौ'}¶
-
unicode_transliterate
Module¶
-
class
indicnlp.transliterate.unicode_transliterate.
ItransTransliterator
[source]¶ Bases:
object
Transliterator between Indian scripts and ITRANS
-
class
indicnlp.transliterate.unicode_transliterate.
UnicodeIndicTransliterator
[source]¶ Bases:
object
Base class for rule-based transliteration among Indian languages.
Script pair specific transliterators should derive from this class and override the transliterate() method. They can call the super class ‘transliterate()’ method to avail of the common transliteration
acronym_transliterator
Module¶
-
class
indicnlp.transliterate.acronym_transliterator.
LatinToIndicAcronymTransliterator
[source]¶ Bases:
object
-
LATIN_ALPHABET
= ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']¶
-
LATIN_TO_DEVANAGARI_TRANSTABLE
= {97: 'ए', 98: 'बी', 99: 'सी', 100: 'डी', 101: 'ई', 102: 'एफ', 103: 'जी', 104: 'एच', 105: 'आई', 106: 'जे', 107: 'के', 108: 'एल', 109: 'एम', 110: 'एन', 111: 'ओ', 112: 'पी', 113: 'क्यू', 114: 'आर', 115: 'एस', 116: 'टी', 117: 'यू', 118: 'वी', 119: 'डब्ल्यू', 120: 'एक्स', 121: 'वाय', 122: 'जेड'}¶
-