MKU-
RUSA sponsored National Training Workshop on Language Technology for Tamil
during 22-24 March, 2022,Department of Linguistics,Madurai Kamaraj
University,Madurai.
மதுரை
காமராசர் பல்கலைக்கழக மொழியியல் துறையில் தமிழுக்கான மொழித் தொழில் நுட்பம் என்ற பயிலரங்கம் மார்ச் 22 -24 வரை நடைபெற்றது. இப்பயிலங்கில்
மொழியியல் துறைப் பேராசிரியர்கள கலந்துகொண்டு பல்வேறு தலைப்புகளில் மொழித்தொழில் நுட்பம்
குறித்து உரை வழங்கினார்கள்.
பேரா. எல். இராமமூர்த்தி
நிரலாளர் முனைவர் இரா.அகிலன்
பேராசிரியர் திருமதி ரேணுகாதேவி
நிகழ்வின் ஒருங்கினைப்பாளர் முனைவர் கா.உமாராஜ்
மொழியியல் துறைத்தலைவர் பேரா.முனியன், முனைவர் க.பசும்பொன், பேரா.கி.கருணாகரன்
எல் இராமமூர்த்தி அவர்களிடம் நான் எழுதிய இந்திய உயர்கல்வி நிறுவனங்களில் இணையவழிக் கல்வி என்ற நூலை வழங்கியபோது
இணையத்தமிழ்
ஆய்வாளர் முனைவர் துரை.மணிகண்டன் பேச்சுத் தொழில்நுட்பம் (speech technology) என்ற தலைப்பில் வழங்கிய உரையில்
இணையத்தமிழ் ஆய்வாளர் துரை.மணிகண்டன்
பேச்சுத் தொழில்நுட்பம் என்றால் என்ன?
பேச்சுத் தொழில்நுட்பம் என்பது ஒரு வகையான கணினி தொழில்நுட்பமாகும், இது ஒரு மின்னணு சாதனத்தை பேசும் வார்த்தை
அல்லது ஆடியோவை அடையாளம் காணவும், பகுப்பாய்வு செய்யவும் மற்றும் புரிந்துகொள்ளவும் உதவுகிறது.
இது பொதுவாக டிஜிட்டல் ஒலி சமிக்ஞைகளை உள்ளீடு செய்வதன் மூலமும், சேமிக்கப்பட்ட வடிவங்களின் நூலகத்துடன் அதன்
வடிவத்தை பொருத்துவதன் மூலமும் செய்யப்படுகிறது.
எவ்வாறு பேச்சுத்தொழில்நுட்பம் செயல்படுகிறது?
machine
learning - artificial
intelligence
frequency – அதிர்வெண்
voice
technology
பேச்சு தொழில்நுட்பம் தொடர்பு செயலாக்கம் மற்றும் இயந்திர கற்றல் ஆகிய
கருத்துகளை சார்ந்துள்ளது. பேச்சாளரின் பண்புகள், பின்னணி இரைச்சல் மற்றும் அதிர்வெண் போன்ற
தொடர்புடைய தகவலைப் பேச்சிலிருந்து பிரித்தெடுக்க சமிக்ஞை செயலாக்கம்
பயன்படுத்தப்படுகிறது.
தானியங்கி பதிலைத் திரும்பப் பெறுவது போன்ற விரும்பிய வெளியீட்டைச் செய்ய
பேச்சு சமிக்ஞைகளை அடையாளம் காணவும் பகுப்பாய்வு செய்யவும் இயந்திர கற்றல் இந்த
கேட்கும் சாதனங்களுக்குப் பயன்படுத்தப்படுகிறது.
பேச்சுத்தொழில்நுட்பத்தின் துணைத் துறைகளாக,
1. speech
recognition
2. speech
verification
3. real-time
speech to text conversion
- interactive
voice response (IVR)
- speech
synthesis
- speech
analytics
போன்றவையும் சிறப்பாக கூறலாம்.
பேச்சுத் தொழில்நுட்பத்தை யாரெல்லாம் பயன்படுத்துகிறார்கள்?
பேச்சு தொழில்நுட்பம் மற்றும் ஒலி வெளியீடு (ஸ்பீக்கர்) சரிபார்ப்பு
தளங்கள், சட்ட அமலாக்க
நடைமுறைகள் மற்றும் செயல்முறைகளில் ஒரு நபரின் குரலை அடையாளம் கண்டு சரிபார்க்க பயன்படுகிறது.
வாடிக்கையாளரின் சேவை மற்றும் ஆதரவை சீரமைக்க நிறுவனங்கள் உரைக்கு உரை மற்றும்
IVR (interactive voice response) செயல்பாடுகள் போன்ற பேச்சு தொழில்நுட்பத்தைப் பயன்படுத்த முடியும்.
பார்வைக் குறைபாடு அல்லது காது கேளாத நோயாளிகளுக்கு உதவ, சுகாதார வழங்குநர்கள் பேச்சு தொழில்நுட்ப
சாதனங்களைப் பயன்படுத்தலாம். .
சிரி, கூகுள் ஹோம் மற்றும்
அமேசான் அலெக்சா போன்ற தனிப்பட்ட பயன்பாட்டு குரல் உதவியாளர்கள் தனிப்பட்ட பேச்சு
தொழில்நுட்ப அனுபவங்களை வழங்கும் சாதனங்கள்.
பேச்சு தொழில்நுட்ப வல்லுநர்கள், பேச்சுப் பொறியாளர்கள் மற்றும் பேச்சு நோயியல் வல்லுநர்கள் உள்ளிட்ட பல்வேறு
தொழில்கள், மாதிரி விகிதம்,
சத்தம் விகிதத்திற்கு சமிக்ஞை மற்றும்
பண்பேற்றம் போன்ற தொழில்நுட்ப ஒலிக் (ஆடியோ) கூறுகளைச் சேகரிக்க
பேச்சு தொழில்நுட்பத்தைப் பெரிதும் நம்பியுள்ளன.
நிகழ்வில் கலந்துகொண்ட மாணவர்கள் மற்றும் பேராசிரியர்கள்
உரை ஒலி – Text to speech
கோப்புகளைத் தமிழில் படித்துக்காட்டும் இணையவழி மென்பொருள்கள் இன்று
அதிகமாக உருவாக்கி வெளியிடப்பட்டுப் பயன்பாடுத்தப்படுகின்றன. அவைமுறையே
https://inforobo.com/text-to-speech-online
https://www.googletexttospeech.com/p/tamil-text-to-speech-online-mp3.html
என்றும் திறந்த மூல மென்பொருளாகவும் கிடைக்கின்றன.
அவை முறையே
https://www.indiadict.com/web/text-to-speech.html
Text To Speech Free
TTSFree.com
https://ttsfree.com/
இவைகளும் கிடைக்கின்றன.
Top Open Source Speech
Recognition Systems என்ற அடிப்படையில் முதல் பத்து இடங்களை பெற்றவையாக
1. Project DeepSpeech (This
project is made by Mozilla, the organization behind the Firefox browser.)
2. Kaldi (Apache public
license.)
3. Julius (1991 at the
University of Kyoto, )
4. Wav2Letter++ (Facebook’s
AI Research Team just 2 months ago.)
5. DeepSpeech2 (Chinese giant Baidu are also working on
their own speech-to-text engine,)
6. OpenSeq2Seq (Developed
by NVIDIA for sequence-to-sequence models training.)
7. Fairseq (Developed by
Facebook and written in Python and the PyTorch framework.)
8. Vosk
9. Athena (TensorFlow.)
10. ESPnet -
Simon James என்ற ஆய்வாளர் தனது ஆய்வுக்கட்டுரையில் குறிப்பிட்டுள்ளார்
தமிழில் பேசுவதை எழுதும் பேச்சுத் தொழில்நுட்பத்தையும்
உருவாக்கி வெளிவந்துள்ளது. அவை முறையே
1.
https://speechnotes.co
- https://dictation.io/speech
- https://www.speechtexter.com/
- https://speechtyping.com/voice-typing/speech-to-text-tamil
இவ்வாறக தமிழில் பேச்சுத்தொழில் நுட்பம்
பல கட்டங்களாக இன்று வளர்ந்து வந்திருப்பது தொழில்நுட்பத்தில் தமிழ்மொழியின் வளர்ச்சியைக்
காட்டுகிறது என்று தனது உரையில் குறிப்பிட்டுப் பேசியுள்ளார்.
பேச்சுத் தொழில்நுட்பம் - speech technology