Sinsy開発元 | 名古屋工業大学 Sinsy Working Group |
---|
|
最新版 | オンライン版:4.1, SourceForge版:0.95 / オンライン版:2020年12月25日 (3年前) (2020-12-25), SourceForge版: 2015年12月25日 (8年前) (2015-12-25) |
---|
リポジトリ | sourceforge.net/projects/sinsy/ |
---|
プログラミング 言語 | C/C++ |
---|
対応OS | Linux |
---|
種別 | ボーカルシンセサイザー |
---|
ライセンス | 修正BSDライセンス |
---|
公式サイト | www.sinsy.jp |
---|
テンプレートを表示 |
Sinsy(しぃんしぃ、Singing Voice Synthesis System)は、名古屋工業大学で開発された歌声合成技術および同技術を応用したボーカルシンセサイザー。メロディーのデータと歌詞を入力することにより、歌声を合成できる。
概要
名古屋工業大学にて開発・メンテナンスが続けられている歌声合成ソフトウェア。オープンソースで公開されているスタンドアロン版と、Webサイトで公開されているオンライン版の2種類がある。
合成技術にHMM(Hidden Markov Model、隠れマルコフモデル)を採用しており、少ないメモリでも動作するのが特徴[1]。2016年12月にはディープニューラルネットワーク(DNN)を用いた日本語ライブラリ「f001j_dnn_beta」がオンライン版でのみ公開され[2]、AI歌唱ソフトとしても使用できるようになった。
メロディーと歌詞の入力データにはMusicXMLというXMLベースの楽譜データを用いる。
現行では3種類の女性の日本語音声(謡子・香鈴・波音リツS)と、1種類の女性(香鈴)と1種類の男性(松尾P)の英語音声、1種類の女性の中国語音声(香鈴)に対応している。
オンライン版
公式サイト[3]上でシステムを公開しており、誰でも無料で利用可能。
サーバーの負荷軽減のため,曲長はHMM版で最大7分、DNN版で5分に制限されている[3]。
オープンソース版
SourceForgeにてLinux版のソースコードが公開されている。利用にはビルドが必要。修正BSDライセンスで公開されている。 ライセンスに従うことでライブラリとして他ソフトウェアに組み込むことも可能。
オンライン版とは異なり、DNNによる歌声合成には対応していない。
関連項目
脚注
- ^ 第429回:シンポジウム 「歌声情報処理最前線! 」レポート その2 ~オープンソースの歌声合成や、“オンチ補正”システムなど ~ - AV Watch
- ^ 2020-11-05現在、「f00001j_dnn_beta2」へとアップデートされている。
- ^ a b Sinsy - HMM-based Singing Voice Synthesis System - 公式サイト
- ^ 大浦圭一郎 - 大浦准教授のプロフィール
- ^ Techno-Speech, Inc. / 株式会社テクノスピーチ
- ^ 使用しているフレームワークはこちらになります。Sinsy(http://sinsy.sourceforge.net) - Twitter
外部リンク
- Sinsy - HMM-based Singing Voice Synthesis System - 公式サイト
- Sinsy - SourceForge版ページ
- Pysinsy - PythonからSinsyを使用するラッパーライブラリ
|
---|
モデル / 手法 | |
---|
エンジン | 商用 | |
---|
フリー | - eSpeak(英語版)
- Gnuspeech(英語版)
- Festival Speech Synthesis System(英語版)
- Open JTalk
|
---|
非OSS | |
---|
|
---|
システム / API | |
---|
ハードウェア | 歴史的 | - DECtalk(英語版)
- Pattern playback(英語版)
- The Voder(英語版)
- Wolfgang von Kempelen's speaking machine(英語版)
|
---|
LSI | - GI SP0256(英語版)
- TI LPC Speech Chips(英語版)
|
---|
娯楽 | - Currah(英語版)
- Echo 2(英語版)
- Phasor(英語版)
- Intellivoice(英語版)
- Speak & Spell(英語版)
- PC-6000シリーズ
- PC-6600シリーズ
- Yamaha CX5M(英語版)
|
---|
|
---|
応用ソフトウェア | |
---|
アクセシビリティ | - RIAS(英語版)
- Silent speech interface(英語版)
- Speech-generating device(英語版)
- Spoken Web(英語版)
- TuVox(英語版)
スクリーン リーダー (リスト) | |
---|
Self-voicing | |
---|
音声ブラウザ | |
---|
ブラウザ拡張 | フリー | - Fire Vox(英語版)
- Text to Voice(英語版)
|
---|
|
---|
サイト拡張 | 商用 | - BrowseAloud(英語版)
- Readspeaker(英語版)
|
---|
|
---|
|
---|
ボーカルシンセ | |
---|
サービス・サイト | - Odiogo(英語版)
- Quack.com(英語版)
|
---|
プロトコル | |
---|
開発者・研究者 | - Catherine Browman(英語版)
- Franklin Seaney Cooper(英語版)
- Gunnar Fant(英語版)
- Haskins Laboratories(英語版)
- ヴォルフガング・フォン・ケンペレン
- Ignatius Mattingly(英語版)
- Philip Rubin(英語版)
- CereProc(英語版)
- IVONA(英語版)
- VoiceWeb(英語版)
- ヤマハ
|
---|
関連分野 | |
---|
カテゴリ |