За последние 24 часа нас посетили 63035 программистов и 1741 робот. Сейчас ищут 904 программиста ...

Распознавание речи

Тема в разделе "Прочие вопросы по PHP", создана пользователем ng0d, 8 сен 2011.

  1. ng0d

    ng0d Активный пользователь

    С нами с:
    7 фев 2009
    Сообщения:
    100
    Симпатии:
    0
    Адрес:
    Латвия
    Кто то пробовал такое делать средствами PHP? То-есть какая то программа сохраняет спектр звуковых волн в картинки, далее средствами PHP происходит распознавание содержимого картинок, потом происходит сохранение в текст.
     
  2. Apple

    Apple Активный пользователь

    С нами с:
    13 янв 2007
    Сообщения:
    4.984
    Симпатии:
    2
    Чтобы это писать на РНР нужно быть не совсем здоровым =)

    Боюсь, что тут всё каапельку сложнее с транспозицией.
    Нелинейное бинарное чтение с использованием кодека, рассчет опорных точек ... и всё это с нуля на РНР? ;)
     
  3. ng0d

    ng0d Активный пользователь

    С нами с:
    7 фев 2009
    Сообщения:
    100
    Симпатии:
    0
    Адрес:
    Латвия
    Мне надо именно на PHP, я здоров, поверьте. :)

    Распознавание вот таких вот картинок.

    [​IMG]
     
  4. Apple

    Apple Активный пользователь

    С нами с:
    13 янв 2007
    Сообщения:
    4.984
    Симпатии:
    2
    Такие картинки - тупик.

    Если у тебя есть звуковой файл, то не нужно никакие картинки генерировать.
    Картинка - это визуальное представление. Чтобы сделать представление - нужны данные.
    Эти данные получены из рассчетов, так вот ДО рассчетов есть стадия обработки сигнала.
    Именно этот сигнал и нужно сравнивать.
     
  5. igordata

    igordata Суперстар
    Команда форума Модератор

    С нами с:
    18 мар 2010
    Сообщения:
    32.408
    Симпатии:
    1.768
    пхп обладает охуенным быстродейсвием при работе с графикой. ureal engine 3 написан на пхп.
     
  6. YSandro

    YSandro Старожил

    С нами с:
    7 апр 2011
    Сообщения:
    2.523
    Симпатии:
    2
    На Perl делал обратное - что-то вроде синтезатора речи.
    Анализатор речи нужно писать на C. Может быть, можно сделать расширение для PHP. Но кто этим займётся, кому делать нефиг? Программе нужно давать звуковые данные в максимальном качестве, несжатые, с максимальной частотой дискретизации, чтобы хоть что-то можно было разобрать (учитывая, что компьютерные микрофоны, гарнитуры всякие уже сильно искажают сигнал). А для передачи по сети данные сжимаются с потерями, так что возможное применение такого анализатора - только локальная машина.
    PS. Сохранённые в виде картинки сигналы - это ещё одна ступень сжатия данных с потерями, т.к. идёт привязка закрашенных участков к пикселям картинки. Если картинка векторная - ещё что-то возможно.
     
  7. Jnas

    Jnas Активный пользователь

    С нами с:
    31 май 2011
    Сообщения:
    22
    Симпатии:
    0
    Я конечно в таком не спец.
    но помню раскладывали мы сигналы в Вузе в спектр с помощью ряда Фурье.
    может Вам стоит не картинки сравнивать, а сам как бы "массив" спектр сравнивать.