프로그램 사용/ai 프로그램

supertone/supertonic3 시도

구차니 2026. 5. 10. 18:19

알아서 받고 한글도 정말 잘 변환해준다.

잠시 검색해보니 한국 회사인것 같고. hybe 자회사로 게임같은데서 보이스 체인저로 유명한 듯?

라이센스는 좀 읽어 봐야겠지만 대충 번역기 돌려서 보니 SaaS 까지도 허용하는 것 같긴한데..

 

outetts 처럼 빌드는 필요없이 그냥 pip만으로 설치되니 good!

그리고 auto_download 하면 먼가 열심히 받고 알아서 한다.

D:\study\llm>pip install supertonic
D:\study\llm>python
Python 3.10.6 (tags/v3.10.6:9c7b4bd, Aug  1 2022, 21:53:49) [MSC v.1932 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from supertonic import TTS
>>> tts = TTS(auto_download=True)
Downloading (incomplete total...): 0.00B [00:00, ?B/s]                                                                 Warning: You are sending unauthenticated requests to the HF Hub. Please set a HF_TOKEN to enable higher rate limits and faster downloads.
Fetching 26 files: 100%|███████████████████████████████████████████████████████████████| 26/26 [00:36<00:00,  1.40s/it]
Download complete: : 404MB [00:36, 19.4MB/s]                                                                           >>> style = tts.get_voice_style(voice_name="M1")
>>>
>>> text = "A gentle breeze moved through the open window while everyone listened to the story."
>>> wav, duration = tts.synthesize(text, voice_style=style, lang="en")
>>>
>>> tts.save_audio(wav, "output.wav")
>>> print(f"Generated {duration:.2f}s of audio")

>>> text = "안녕? 난 잼미니야 만나서 반가워"
>>> wav, duration = tts.synthesize(text, voice_style=style, lang="ko")
>>> tts.save_audio(wav, "output_ko.wav")

 

[링크 : https://huggingface.co/Supertone/supertonic-3]

[링크 : https://www.supertone.ai/ko]