Russian - English, Spanish, German, French,... - Free Machine Translation | Google Translation from Russian (ЧаВо) |
Перевод - дело тонкое!Машина переводить не может! С этим утверждением филологов нельзя не согласиться, ведь работая с текстом мы вступаем в самую запутанную из доступных нам сфер - отношения людей. Однако, точно так же не могут переводить ни авторучка, ни пишущая машинка, ни книга (словарь). Если компьютер всего лишь объединит свойства пишущей машинки и словаря, то этим уже облегчит именно человеческие труды, и хоть немного сократит подавляющее превосходство усидчивости над озарением. А ускорение нетворческих операций открывает простор для многовариантности, как в мультфильме "Пластилиновая ворона". Легко понять недовольство переводчиков вторжением в их угодья грубых пришельцев верхом на невиданной технике. Так же ворчат, скажем, шахматисты: вспомним нашумевшую дуэль чемпиона мира с процессором Pentium (а ведь сглазили-таки этот процессор, сколько было шума вокруг выявленных в нем ошибок - уж не за слишком ли бойкое отношение к древней почтенной игре?) Но, разумеется, было бы глупо и самонадеянно игнорировать опыт многих предшествующих поколений переводчиков. Собственно, информационная техника и придумана для облегчения передачи человеческого опыта. С расширением международных связей растёт спрос на услуги перевода с одного языка на другой. И тут очень кстати оказывается стремление информационной отрасли, выражаясь техническим жаргоном, "оцифровывать" всё больше человеческих умений, то есть воплощать их в машинные программы массового пользования. Началось с простейшего пословного перевода; карманные электронные словари уже давно имеются в продаже. Оказалось, однако, что кроме обычного простейшего словаря настоящему переводчику нужно ещё множество непростых справочников. Следует отметить судьбоносную важность расширения межнационального информационного обмена для облегчения и гуманизации вхождения новых участников в международное разделение труда. Очевидно, достичь зрелости СМП смогут именно при участии в больших международных проектах. Актуальное направление - лингвистическая поддержка массовых международных сетевых коммуникаций. В частности, поддержка национальных программ оперативного поиска и перевода информации в Интернет. Здесь к проблемам поддержки национальных грамматических справочников добавляется путаница с многочисленными, противоречащими друг другу, стандартами кириллических кодировок. Постепенно расширяясь, зеркало информационной техники отражает все больше чисто человеческих, традиционно гуманитарных ценностей. По мере их накопления, неизбежно будут расширяться стремления и возможности к их систематизации, анализу и, в конце концов, созданию новых, при помощи специфического компьютерного инструментария. Применительно к любым языковым программам это и означает перспективу постепенного овладения машинами (программами) живой человеческой речью. В частности, ширятся возможности пополнения всевозможных словарей на основе накопленных текстовых образцов. Растут и аналитические средства, стимулируемые, например, криптографией и другими шпионскими целями. Известная идея: рассматривать текст на чужом языке как зашифрованный текст на языке родном. Проблема сродни одному из критериев разумности, павшему в 70-е годы: можно ли создать компьютерную программу, которая в процессе живого разговорного диалога (через текстовый терминал) синтезировала бы текст, неотличимый от живой человеческой речи? Еще шире формулировали так: может ли машина разумно разговаривать? Подражая Вольтеру, следовало бы ответить: "Тоже нет" (ему-то задали вопрос: есть ли у животных душа?). Мечта древних мудрецов о машинном переводе и посегодня не воплощена в полной мере! Ибо, как давно уж сказано: "Есть многое на свете, друг Горацио, что и не снилось нашим мудрецам". К езде на машинах придется привыкать, и не обязательно сразу на самых мощных; ведь информатика специально придумана как раз для плавания по волнам все усложняющейся жизни. Правда, вовлекаясь в эту забаву, порой забываешь о первоначальных целях и намерениях. Как сказано в эпилоге "Левши", "благоприятствуя возвышению заработка, машины не благоприятствуют артистической удали". Творческому артистизму приходится вновь и вновь пробивать себе путь в более возвышенные сферы, выходить на новые тропы в доселе нехоженных просторах. Но следом, неизбежно, снова потянется плебс. В Украине эти вопросы решают всего 2-4 группы, примерно столько же и в России. Академические организации и ВУЗ'ы имеют огромные теоретические наработки - словари и справочники, однако весь материал ориентирован на анализ, препарирование. Для синтеза жизнеспособных, а тем более коммерческих программ перевода нужны творческий подход, обширные знания, время и средства. Рабочие руки найти нетрудно, проблема найти хорошие. |
Машинный перевод. Словари РУА с украинским интерфейсом. Слово живое и мёртвое. Олжас Сулейменов: Историческоe языковедениe. Сказания о начале славянской письменности. Скептический взгляд на официальную историю. Как создается словарь русского языка с компьютером и без. Проблемы машинного перевода. Компьютерный анализ текстов Сетевой У-Р перевод Многоязыковый перевод Он-лайновi словники |
Не оставляй торчащих гвоздей!
Глупо требовать, чтобы программа выдавала полноценный литературный текст; ведь даже после живого человека с серьезным материалом работает редактор. В небанальных специальных случаях до 10% данных могут потребовать консультаций со справочниками и со специалистами. В связи с этим следует различать техническую скорострельность получения подстрочника (скажем, 2 сек/страница) и практическую производительность по итоговому тексту (хотя бы до 30 страниц в день). Не всегда заказчику нужен литературный перевод; иногда как раз полезнее подстрочник или краткая аннотация. Главное же, что требуется от современных программ перевода:
Достигается это за счет автоматизации трудоемких ручных операций: печатания текста и поиска по словарям и справочникам. Как минимум, при "лечении" текста от иностранного языка, надо не слишком исказить его содержание; как говорят медики, главное - не навредить! По мере коммерческого становления этих работ, накопления статистики и фондов, можно будет уделить внимание литературной стилизации, подобно тому, как ныне привычным стало искусство каллиграфии в виде многочисленных компьютерных шрифтов. |
Сайт, а особенно ссылки с него, состоянием на начало 2000-х годов. Железный конь идет на смену крестьянской лошадке!
Остап Бендер Техническое творчество, отличаясь от художественного по форме, по сути тоже есть общение с миром и с собою в мире. Имея множество недостатков, инженерный взгляд на мир ценен почти женским стремление не только плодоносить во что бы то ни стало, но и менять к лучшему жизнь. Каждый продукт проектирования включен одновременно во множество структур, которые до определенной меры автономны и при удачном описании могут быть устойчивы к изменениям. Без широкой культурной основы работа не может развиваться, как пирамида не может опираться на вершину. Не прислонить ли эти лозунги к какой-нибудь вечной проблеме, одной из тех что легко формулируется, но не имеет легкого решения? |
Синтаксис и морфологияГлокая куздра штеко бурдланула
При создании любого текста элементы языка подчиняются содержанию. При переводе же следует на время максимально вытеснить содержание углубленным анализом формы. Ни сам компьютер, ни системное ПО не знают правил русского (английского, украинского, грузинского ...) языка, и пользуясь одними только словарями переводчик будет снова и снова наступать на одни и те же грабли. Поэтому необходимо прежде всего уделить внимание созданию грамматических справочников. Это даже удобнее - ведь слов несколько десятков тысяч, и они меняются, а грамматических форм всего пара сотен, и они относительно стабильнее. В этих же справочниках должны содержаться и служебные части речи: союзы, предлоги, местоимения, префиксы, суффиксы, окончания, частицы, артикли и т.п. Можно еще присовокупить минимум общеупотребительных смысловых слов (скорее глаголов, чем существительных?). Грамматические, неизменяемые словосочетания (конструкции) следует обрабатывать иначе, чем сочетания корней значащих слов, для которых создаются отдельные словари. Понятно, что перевод отдельных слов и даже морфем должен употребляться только в тех случаях, когда для них не найдены более крупные конструкции, лучше учитывающие контекст. Существует также такая важная категория слов и сочетаний, как имена и названия, которые переводятся по совершенно своеобразным правилам, а при первом вхождении в текст могут также даваться в оригинале. Возможно следующее построение: справочники исходного и целевого языка и таблица соответствия, в которой предлагаются варианты перевода языковых конструкций. На бумаге это все можно попытаться записать в виде БНФ или древовидных структур, а программировать, видимо, с помощью объектно-ориентированного программирования. |
Программы машинного перевода нужны:
Платежеспособный спрос, видимо, преобладает именно со стороны второй из этих категорий (так что есть смысл экономить на диалоге). Обидно, разумеется, распылять силы на мелочевку, но полезно было бы окружить основную большую работу облаком сопутствующих демонстрационных штучек - словариками, утилитами, игрушками, календариками и рекламками, с целью привлечения максимума общественного внимания (и денег). |
Лексикология и лексикография.Словарь Эллочки-людоедки состоял
Многие смысловые слова, конечно, придется тоже вводить. Разумеется, планирование их структур и ввод требует специальных филологических и кибернетических знаний, большого обьема труда и специально разработанных программ. Вероятно, в качестве поисковых признаков должны храниться корни и неправильные формы слов. Соблазнительно наполнить машинный словарь, отсканировав хорошее бумажное издание. Опуская проблему лицензирования, отметим низкую надежность оптического ввода многоязыковых многошрифтовых текстов; очевидно, правильнее покупать такой словарь у его составителей или в издательстве, прямо на машинном носителе. Однако традиционный словарь во многом избыточен, а многие умолчания рассчитаны на человеческую догадливость. Машинные словари имеют большую трудоемкость и ценность. Не потому ли их создатели не стремятся стандартизовать форматы данных, что опасаются незаконного использования конкурентами? Необходимый минимум для ручного перевода любого текста - общеграмматический справочник и 2-язычный словарь специальных терминов данного текста. К этому и будем стремиться придти ... Искусство выращивания словарей.Очень привлекательный компромиссный путь - постепенное наполнение словаря на конкретном текстовом материале, путем полуавтоматического запоминания незнакомых слов. Это наиболее "чистое" воплощение модели обучения в ходе практической деятельности; однако вслед за оперативным запоминанием обязательно должен следовать этап анализа новых слов и оснащения их полным грамматическим аппаратом. Этот метод народной стройки чреват угрозой Вавилонского столпотворения, т.к. программные системы слишком легко аккумулируют человеческие недостатки: неприятно заражения словаря искажённой лексикой. Профессиональный переводчик, как любой исследователь-первопроходец, нередко вынужден заниматься словотворчеством; процесс этот отчасти регламентируется. Отметим, что в более цивилизованных странах существуют фонды национальных языков, и даже законы о единообразии перевода неологизмов. Это и есть практическое выражение любви к национальной культуре. Нужно создать возможности для активного формирования индивидуальных рабочих словарей на научной основе, с использованием модульности, структурирования, документирования, наглядности и других полезных изобретений практической информатики. Как раз необходимость постоянного профессионально-языковедческого мониторинга словарей даёт великолепный шанс для организации финансирования работ. То есть система машинного перевода, подобно широкоизвестным антивирусным программам, должна ностальгически рваться к истокам; жаждая обновления, приникать к животворному сайту родной фирмы. И при этом регулярно оплачивать свои вожделения. |
Структуры текстов.Казнить нельзя помиловать.
Из всего богатства достижений структурной лингвистики популярные текстовые процессоры ныне используют следующее:
Нам же надо придумать такую структуру, которая отразила бы взаимоотношения понятий, как принципиальная схема отражает и логику и конструкцию прибора. Такая схема не изменится при переводе, и займет в структуре целевого языка такое же место, какое занимала в структуре исходного. Ну например, разбирая текст, построим таблицу, в которой 1-я и 3-я колонки содержат понятия (или замещающие их местоимения), входящие в переводимый текст, во 2-й помещены вспомогательные слова, которые их в этом тексте связывают, а в 4-й количество повторений такой связи. |
Эскиз постановки задачи.Делать быстро - это делать медленные
|
Форма и содержание.Среди недобитой "социальной прослойки" - советской интеллигенции,- была одна привилегированная категория, кичащаяся свободомыслием и панибратством с верховными владыками - "секретные физики". Уже одниим только созданием атомной бомбы эта каста заставила весь мир себя побаиваться. "Работает в ящике - начертано на его бледном челе", писал о них Михаил Анчаров, имея в виду отсутствие нормальных почтовых адресов у сплошь милитаризованных и засекреченных советских учреждений. Всех прочих работников умственного труда, в противоположность, называли "лириками", и всяческие мракобесы высмеивали их всеми возможными способами. В переполненном историческими событиями 1961 году, в мае, в Московский университет на День физика приехал великий датский ученый Нильс Бор. На пресс-конференции ему задали вопрос: - Как Вам удалось создать столь значительную научную школу? - Я никогда не стеснялся перед своими учениками назвать себя дураком - демократично ответствовал мэтр. Переводил его ответы великий советский физик Лев Давидович Ландау, который воспроизвел фразу не совсем точно: - Я никогда не стеснялся перед своими учениками назвать их дураками! Под хохот зала ведущий (кажется, это был академик Петр Леонидович Капица) исправил нюанс, заметив, что в этом-то и состоит отличие научных школ Бора и Ландау. Лирическое отступление.В жизни все совсем не так,
В начале 80-х г.г. в "Докладах Академии наук" была опубликована красивая космологическая идея, что размерность физического мира не является постоянной глобальной характеристикой Вселенной, а более-менее независимо флуктуирует в каждой отдельной точке пространства, принимая любые значения от 0 до бесконечности. Наиболее вероятное значение размерности пространства, в котором оно чаще всего пребывает, что-то около 6-7. Не так ли и в мире идеальном - в искусствах, литературе: одна-единственная запятая, один штрих может в корне изменить смысл всего произведения - и тут же снова уйти в тень, снова стать незначительной мелочью! И к тому же, с древних времён мудрецы учат, что для постижения любого явления следует познать не менее семи его сущностей. Идея эта подкреплена экзотичным математическим построением, сказочными биографиями ее автора, авиаконструктора Роберта Ороса Людвига ди Бартини и ее "крестного отца" Бруно Понтекорво (одного из "атомных академиков", и тоже беглеца из Италии), а также чрезвычайно убедительным следствием - табличкой из трех колонок, строк этак на 20. В первой колонке перечислены такие мировые константы, как скорость света, гравитационная постоянная, заряд электрона и т.п. Во второй колонке приведены значения этих Богом данных величин, полученные в результате чрезвычайно тонких и громоздких опытов с предельной для нынешней науки точностью - порядка 15 знаков. А в третьей колонке приводятся значения тех же величин, вычисленные согласно данной теории. Совпадение - знаков 13-15. То есть на правду ну очень похоже! Замечательна отправная точка этих публикаций: "Предположим, что наша Вселенная единственна". Что-то наподобие "В некотором царстве, в некотором государстве"... Оказывается, это буквальная цитата из - кого бы вы подумали? - Джордано Бруно! "...Итак, Вселенная едина, бесконечна, неподвижна... Она не движется в пространстве... Она не рождается... Она не уничтожается... Она не может уменьшаться или увеличиваться..." Но какой поворот сюжета - такое богатство конкретных результатов из чисто негативной общефилософской предпосылки! С биографией Р.Бартини можно ознакомиться по книге: И.Э.Чутко.Красные самолеты. М.Политиздат, 1978, 128 стр. Впрочем, вся его биография отразилась в вышеописанной теории: детство он провел в доме-Вселенной, единственном и неповторимом, прожил сказочно многомерную жизнь, и как результат ее создал замечательные произведения, как на бумаге, так и в металле. |