Итак, чтобы распознать, нужно знать, как произнести. В момент проверки "что я слышу" ИИ должен спросить себя "как бы я это сказал".
У каждого человека разный тембр голоса, свои характеристики.
Было бы хорошо для начала синтезировать голос и посмотреть, насколько разным его можно сделать при помощи компьютера, сможет ли он покрыть всё многообразие человеческих голосов и интонаций.
У каждого человека разный тембр голоса, свои характеристики.
Было бы хорошо для начала синтезировать голос и посмотреть, насколько разным его можно сделать при помощи компьютера, сможет ли он покрыть всё многообразие человеческих голосов и интонаций.
Ну да, чтобы распознать - надо представить как бы мы это сказали. Чтобы распознать рукописный текст надо представить как бы мы это написали
ОтветитьУдалить