Попытка решения проблем систем распознавания речи для заикающихся людей

Описание: Здесь можно: дискутировать на ЛЮБЫЕ темы,
флудить и оффтопить.
Модераторы: Skif, Inkognito

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #1 AnastasiyaSmith » 07.10.2014, 01:55

Здравствуйте, уважаемые форумчане!

Я студентка пятого курса университета и в этом году я пишу диплом. Темой выбрала: распознавание речи. В начале этого года заинтересовалась проблемами заикающихся людей при работе с системами распознавания речи. Оказалось, что проблемы есть, и их, почему-то, никто не решает. Я сделала это темой своего исследования, и в будущем, диплома.

Гипотеза, которую я хочу проверить, заключается в том, что участки речи, соответствующие заиканию, могут быть автоматически распознаны системой с целью их дальнейшего изменения.

Обращаюсь к Вам, потому что для проведения анализа речи мне необходимы её образцы. Первой мыслью было взять ролики с ютуба и того же vk, но при загрузке на сервер происходит огромная потеря информации и звук в видео (записи) становится уже не "чистым".

Поэтому я хочу попросить Вас записать буквально пару минут своей речи на диктофон и прислать мне. Если в речи будут сложные слова - это будет восхитительно, т.к. анализу будут подвергаться именно они.

Я гарантирую полную анонимность. И для этого зарегистрировала облачное хранилище на mail.ru
чтобы скинуть туда запись, необходимо перейти по ссылке https://cloud.mail.ru/
ввести логин: forsciencemath@mail.ru
и пароль: For*science*math8
Это абсолютно безопасно, от Вас не требуется никаких личных данных.

Я с удовольствием отвечу на вопросы.

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #2 AnastasiyaSmith » 13.10.2014, 03:24

Пожалуйста! Помогите мне. Будет очень обидно, если исследование закончится, не успев начаться, из-за нехватки материала. В научном мире уже заинтересовались темой и ждут каких-то результатов.

Alexander_Svetozarov
Аватара
Alexander_Svetozarov
Репутация: 589
Лояльность: 1100
Сообщения: 3484
С нами: 12 лет 9 месяцев

Сообщение #3 Alexander_Svetozarov » 13.10.2014, 09:22

AnastasiyaSmith писал(а):Я студентка пятого курса университета и в этом году я пишу диплом. Темой выбрала: распознавание речи. В начале этого года заинтересовалась проблемами заикающихся людей при работе с системами распознавания речи.

AnastasiyaSmith, безусловно, Ваше мировосприятие опережаете своё время. Та проблематика, которую Вы затронули - очень актуальна. Система распознавания речи для заикающихся обязательно должна быть создана, ведь заикающиеся - это существа с другой планеты, и землянам крайне необходимо иметь в своём наличии устройство анализа, преобразования и перевода речи таких внеземных форм, как заикающиеся.

AnastasiyaSmith писал(а):Поэтому я хочу попросить Вас записать буквально пару минут своей речи на диктофон и прислать мне. Если в речи будут сложные слова - это будет восхитительно, т.к. анализу будут подвергаться именно они.

AnastasiyaSmith, добрый мой Вам совет - пока не поздно, измените тему своей дипломной работы (минимум, будьте честны сами с собой), поскольку Вы не понимаете о чём говорите. Почему? Как минимум, потому, что 99% заикающихся людей наедине с самими собой даже не заикаются. Так что диктофонных записей Вы будете ждать очень и очень долго.
Об неактуальность Вашей идеи свидетельствует хотя бы тот факт, что Ваша тема до сих пор никого не заинтересовала.


AnastasiyaSmith писал(а):Оказалось, что проблемы есть, и их, почему-то, никто не решает.

Действительно, проблема существует и должным образом не изучается в научных кругах, но хочется надеяться, что исследователи подобные Вам, всё-таки будут обходить стороной аналогичные исследования, поскольку каждый хорош на своём месте (а Вы, судя по всему, явно не на своём). Как итог, и своё время можете зря потратить, так и других людей в заблуждение вводить начнёте.

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #4 AnastasiyaSmith » 13.10.2014, 11:33

Alexander_Svetozarov писал(а):добрый мой Вам совет - пока не поздно, измените тему своей дипломной работы

Я бы изменила, если бы был обратный путь. Это осложняется тем, что этим уже ОЧЕНЬ заинтересовались в научном обществе люди, которые поумнее меня будут.

Alexander_Svetozarov писал(а):99% заикающихся людей наедине с самими собой даже не заикаются.

А не наедине с собой? Мой молодой человек тоже заикается. И он любит использовать систему голосового управления на Android "ok, google, now", если знаете. Так вот не далее, чем пару недель назад возникла ситуация, когда система не дождалась молодого человека, как диктора, посчитав, что он уже закончил. Стоит ли говорить, что это как минимум неприятно?

ans7 M
Аватара
ans7 M
Репутация: 3932
Лояльность: 1665
Сообщения: 10804
С нами: 11 лет 9 месяцев
Откуда: EE

Сообщение #5 ans7 » 13.10.2014, 11:47

AnastasiyaSmith, посмотрите на форуме. Здесь многие выкладывали записи своего голоса в общественных местах. А еще аудио версию книги речь как река озвучивали наши форумчане. Зайдите на ту ветку.
"Человек - это то, что он думает на протяжении дня". Ральф Уолдо Эмерсон

UP
Аватара
UP
Репутация: 3255
Лояльность: 5572
Сообщения: 13278
С нами: 16 лет 6 месяцев

Сообщение #6 UP » 13.10.2014, 12:05

AnastasiyaSmith писал(а):И он любит использовать систему голосового управления на Android "ok, google, now", если знаете. Так вот не далее, чем пару недель назад возникла ситуация, когда система не дождалась молодого человека, как диктора, посчитав, что он уже закончил. Стоит ли говорить, что это как минимум неприятно?
у нынешних молодых человеков очень много неприятностей:). которых не было 10 лет назад. от лайков от вконтакта от инстаграмма от твиттера....

от машины не может быть неприятностей. это машина. там зашита средняя длинна паузы между словами. вычисленное на основе анализа больших объемов аудио-данных. если 777млрд пользователей андроида тарахтят, а он мычит. это его проблемы. думаю нет смысла дуться на смартфончик. ему в нем еще птиц в свиней.

меня гуглотранслятор тоже не понимает. буквально каждое предложение бывает с 10го раза.

и да, если ты заткнулся в спазме и даже не мычишь, то гоогл думает ты заткнулся. фраза закончена.

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #7 AnastasiyaSmith » 13.10.2014, 12:25

ans7 писал(а):AnastasiyaSmith, посмотрите на форуме. Здесь многие выкладывали записи своего голоса в общественных местах. А еще аудио версию книги речь как река озвучивали наши форумчане. Зайдите на ту ветку.

Я бы не создавала тему и не создавала неудобств для людей. Просто записи при загрузке на сервер теряют очень много информации, которая может быть полезна, а мне нужен абсолютно свежий звук.

Большое спасибо всем за отклики. Я надеюсь, вы правильно меня поймете. Немного расскажу о предыстории появления такой темы.
Мы с моим молодым человеком (напомню, он заикается), хотим построить своими силами умный дом. Естественно с голосовым управлением. Когда стали копать глубже, молодой человек понял, что голосом управлять ему будет сложно. Задумались над если не созданием своей, то модифицированием уже имеющихся систем распознавания.
Идеи, как это сделать, есть, поддержка умных людей есть, нет только материала для начала работы.

holdas
Аватара
holdas
Репутация: 372
Лояльность: 1220
Сообщения: 1076
С нами: 12 лет 10 месяцев

Сообщение #8 holdas » 13.10.2014, 12:47

Мне то казалось что 99.9% не заикаются на микрофон, а если и заикаются то после небольшой практики приходит привыкание и запинки пропадают. Исключение. конечно, когда микрофон располагается в аудитории полной людей))

UP
Аватара
UP
Репутация: 3255
Лояльность: 5572
Сообщения: 13278
С нами: 16 лет 6 месяцев

Сообщение #9 UP » 13.10.2014, 12:52

гугли "хабр умный дом".
на самом деле для заикатора всё можно упростить. там ничего распознавать то не надо. по принципу бабушкофона. нажал 1 вызвался сын нажал 2 вызвалась его жена нажал 3 вызвался внук нажал 4 вызвалась скорая.

окей гугл один. одна команда.
окей гугл два. другая команда.
окей гугл три. другая команда.
легче произносить цифры, например от 1 до 20. чем непосредственно голосовые команды человеческой речью.

:)

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #10 AnastasiyaSmith » 13.10.2014, 12:54

holdas писал(а):Мне то казалось что 99.9% не заикаются на микрофон, а если и заикаются то после небольшой практики приходит привыкание и запинки пропадают. Исключение. конечно, когда микрофон располагается в аудитории полной людей))

Насколько я знаю, очень многие привыкают и разговаривают без запинок со своими половинками и с родственниками, но ведь есть те, у кого не так.

UP писал(а):если 777млрд пользователей андроида тарахтят, а он мычит. это его проблемы.

А почему бы не сделать хорошо всем?

Судя по реакции людей, наверно, надо было сначала провести масштабный опрос на тему: а нужно ли это вообще.
Скажите тогда Вы, уважаемые форумчане, а хотели бы?
Не в разговоре с людьми, а удобно было бы управлять компьютером и вообще какой-нибудь системой голосом, учитывая, что эта система будет подстроена под вас?

Добавлено спустя 3 минуты 30 секунд:
UP писал(а):гугли "хабр умный дом".
на самом деле для заикатора всё можно упростить. там ничего распознавать то не надо. по принципу бабушкофона. нажал 1 вызвался сын нажал 2 вызвалась его жена нажал 3 вызвался внук нажал 4 вызвалась скорая.

окей гугл один. одна команда.
окей гугл два. другая команда.
окей гугл три. другая команда.
легче произносить цифры, например от 1 до 20. чем непосредственно голосовые команды человеческой речью.

:)

Можно забыть, какая команда, что значит. Я, например, была в восторге, когда мой парень просил у телефона, нужен ли ему сегодня зонт и получил полную информацию о погоде. Мы бы хотели создать систему по типу Jarvis в железном человеке.
Разве это не здорово? Да, сложно. Да, трудоемко. Но ведь существуют методы. и успешно применяются. Просто масштабные системы от гугла не направлены на глобальное обучение под конкретного пользователя, а искусственные нейронные сети позволяют это сделать.

UP
Аватара
UP
Репутация: 3255
Лояльность: 5572
Сообщения: 13278
С нами: 16 лет 6 месяцев

Сообщение #11 UP » 13.10.2014, 13:05

опрос ничего не покажет, ибо:). тут 99% людей не поняли что вообще такое значит фраза "на Android "ok, google, now". :mrgreen:

вот я например никогда не пользовался. знаю только потому, что в планшете в телевизоре постоянно эта рекламе мельтешит между переключениями каналов. "окей гугл погода в сочи отели в сочи итд". приложение гуглотранслятора пробовал, он меня не понимает. с тех пор перестал с планшетом разговаривать...

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #12 AnastasiyaSmith » 13.10.2014, 13:34

UP писал(а):вот я например никогда не пользовался. знаю только потому, что в планшете в телевизоре постоянно эта рекламе мельтешит между переключениями каналов. "окей гугл погода в сочи отели в сочи итд". приложение гуглотранслятора пробовал, он меня не понимает. с тех пор перестал с планшетом разговаривать...

А хотите разговаривать? (:

Varuna
Varuna
Репутация: 296
Лояльность: 140
Сообщения: 609
С нами: 20 лет 4 месяца

Сообщение #13 Varuna » 13.10.2014, 13:53

нестыковка какая-то: имея рядом МЧ с заиканием, говорить о том, что нет материала. Он Вам может одним и тем же голосом, но в разном состоянии, наговорить очень много полезного.
Имхо, идея красивая, но затрат не стоит.

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #14 AnastasiyaSmith » 13.10.2014, 14:50

Varuna писал(а):нестыковка какая-то: имея рядом МЧ с заиканием, говорить о том, что нет материала. Он Вам может одним и тем же голосом, но в разном состоянии, наговорить очень много полезного.
Имхо, идея красивая, но затрат не стоит.

Если честно, молодой человек отказался быть "подопытным кроликом". Сказал, что не хочет, чтобы я постоянно слушала его голос. Я надеялась, что найду людей, которым будет всё равно на то, что кто-то слышит их голос, тем более, я за полную анонимность. Да и дело не в разных голосах, а в различном проявлении. И, кстати, когда мой парень меняет голос, то заикание пропадает.

Alexander_Svetozarov
Аватара
Alexander_Svetozarov
Репутация: 589
Лояльность: 1100
Сообщения: 3484
С нами: 12 лет 9 месяцев

Сообщение #15 Alexander_Svetozarov » 13.10.2014, 15:00

AnastasiyaSmith писал(а):Мы с моим молодым человеком (напомню, он заикается), хотим построить своими силами умный дом. Естественно с голосовым управлением.

AnastasiyaSmith писал(а):Если честно, молодой человек отказался быть "подопытным кроликом". Сказал, что не хочет, чтобы я постоянно слушала его голос.

AnastasiyaSmith, Вы противоречите сами себе (пример - две упомянутые цитаты).
Более того, начали Вы с дипломной работы, а закончили строительством умного дома с голосовым управлением. Вы сначала уж сами-то определитесь, что Вы хотите и для чего Вам всё это надо. А может Вы просто клон кого-то из форумчан, и таким образом решили "поугарать" над людьми.

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #16 AnastasiyaSmith » 13.10.2014, 15:28

Alexander_Svetozarov писал(а):Вы противоречите сами себе (пример - две упомянутые цитаты).
Каюсь, цитату не так передала. Если дословно: "Не хочу, чтобы ты слушала мой голос, когда захочешь"

Alexander_Svetozarov писал(а):Более того, начали Вы с дипломной работы, а закончили строительством умного дома с голосовым управлением. Вы сначала уж сами-то определитесь, что Вы хотите и для чего Вам всё это надо.

Первоначально родилась идея умного дома, в процессе изучения его построения пришли к выводу, что необходимо построение (или модификация уже существующей) системы голосового распознавания. Я решила, что хочу взять диплом, результаты которого не канут в лету, а могут быть применены где-то позже. Благо в выборе темы никто не ограничивал. Так что тема исследования является частью дипломной работы. Дипломная работа - частью умного дома и (в планах) кандидатской диссертации. Надеюсь, всё пояснила?) Если что-то ещё смущает, спрашивайте.

Alexander_Svetozarov писал(а):А может Вы просто клон кого-то из форумчан, и таким образом решили "поугарать" над людьми.

Неужели люди, объединенные общим делом, могут такое друг с другом вытворять? Да и смешного ничего в этом я не вижу. Даже причины для смеха найти не могу.

Lit
Аватара
Lit
Репутация: 818
Лояльность: 479
Сообщения: 3470
С нами: 19 лет 1 месяц
Сайт ВКонтакте

Сообщение #17 Lit » 13.10.2014, 15:48

AnastasiyaSmith писал(а):
ans7 писал(а):AnastasiyaSmith, посмотрите на форуме. Здесь многие выкладывали записи своего голоса в общественных местах. А еще аудио версию книги речь как река озвучивали наши форумчане. Зайдите на ту ветку.

Я бы не создавала тему и не создавала неудобств для людей. Просто записи при загрузке на сервер теряют очень много информации, которая может быть полезна, а мне нужен абсолютно свежий звук.

А я бы на вашем месте попросил у ans7 ссылки на темы/посты с этими записями. Послушал бы их - возможно там хороший звук. Если звук не устроит, можно в личке попросить у авторов оригиналы записей.

AnastasiyaSmith
AnastasiyaSmith
Репутация: 1
Лояльность: 1
Сообщения: 9
С нами: 9 лет 5 месяцев

Сообщение #18 AnastasiyaSmith » 13.10.2014, 20:19

Lit писал(а):
AnastasiyaSmith писал(а):
ans7 писал(а):AnastasiyaSmith, посмотрите на форуме. Здесь многие выкладывали записи своего голоса в общественных местах. А еще аудио версию книги речь как река озвучивали наши форумчане. Зайдите на ту ветку.

Я бы не создавала тему и не создавала неудобств для людей. Просто записи при загрузке на сервер теряют очень много информации, которая может быть полезна, а мне нужен абсолютно свежий звук.

А я бы на вашем месте попросил у ans7 ссылки на темы/посты с этими записями. Послушал бы их - возможно там хороший звук. Если звук не устроит, можно в личке попросить у авторов оригиналы записей.

Пожалуй, я так и сделаю! Большое спасибо!

ab cd
ab cd
Репутация: 43
Лояльность: 57
Сообщения: 180
С нами: 9 лет 5 месяцев

Сообщение #19 ab cd » 16.10.2014, 02:03

AnastasiyaSmith писал(а):Так вот не далее, чем пару недель назад возникла ситуация, когда система не дождалась молодого человека, как диктора, посчитав, что он уже закончил. Стоит ли говорить, что это как минимум неприятно?

Бывает что и люди (те самые нейронные сети) не дожидаются, чего же вы хотите от машины.
Поддерживаю совет сменить тему дипломной работы. У вас отправная точка сомнительная: вы почему-то считаете, что человек при наличии альтернативы выберет неудобный для себя метод, в данном случае голосовое управление.

Добавлено спустя 1 минуту 35 секунд:
Баян на тему распознавания голоса

phpBB [video]


Вернуться в «Off Топ»

Кто сейчас на форуме (по активности за 5 минут)

Сейчас этот раздел просматривают: 10 гостей