Thursday, August 30, 2012

Биржи удаленной работы

http://www.kadrof.ru/cat_exchange.shtml

Биржи удаленной работы (2)

Биржи удаленной работы (общие)
  • Weblancer.net - крупная биржа труда для ИТ-специалистов. После регистрации обязательно заполните портфолио - поможет получить больше заказов!
  • Free-Lance.ru - очень раскрученная биржа работы для программистов, дизайнеров, SEO, журналистов, копирайтеров и фрилансеров любой другой специализации. Несколько новых проектов каждый час!
  • Freelance.ru - одна из крупных бирж фриланса в Рунете. Изначально была форумом.
  • FreelanceJob.ru - работа для профессиональных фрилансеров: веб и принт дизайнеров, программистов, SEO, журналистов. Много крупных проектов с хорошими бюджетами. Для регистрации в каталоге требуется портфолио.
  • Revolance.ru - очень удобная и дружелюбная биржа фриланса, рекомендую пользоваться.
  • Free-lancers.net - молодая, но перспективная биржа телеработы для фриласнеров практически любой профессии. Большие возвожности для оформления портфолио. Рейтинг фрилансеров.
  • Webpersonal.ru - удаленная работа для дизайнеров, программистов, менеджеров, оптимизаторов, копирайтеров. Служба является бесплатной - любой желающий может бесплатно зарегистрировать здесь свой аккаунт и получить доступ к основным услугам службы.
  • Freelancerbay.com - перспективный сервис для фрилансеров, большие возможности по настройке аккаунта и портфолио, невысокие цены на платные аккаунты. Заказов достаточно по разным направлениям - копирайтинг, переводы, дизайн, программирование, продвижение сайтов.
  • Free-lance.su - набирающая популярность биржа, новые проекты появляются ежедневно. Среди плюсов сервиса можно отметить наличие прямых контактов работодателей в проекте (почты, аськи, телефона).
  • Есть работа для фрилансера! - предложения телеработы с возможностью обсудить каждый проект. Подборка статей для фрилансеров.
  • Freelancehunt.com - молодая биржа труда для программистов, дизайнеров и технических переводчиков.
  • Dalance.ru - молодая биржа удаленной работы.
  • Netlancer.ru - небольшая биржа труда, работает по принципу тендеров.
  • Best-Lance.ru - молодая биржа удаленной работы, встречаются проекты для начинающих фрилансеров и профессионалов.
  • Top-lance.ru - молодая биржа удаленной работы, раньше на сайте размещались черные списки фрилансеров и работодателей.
  • Freelance.tomsk.ru - небольшая биржа удаленной работы, новые вакансии появояются практически каждый день.
  • Freelancerbay.com - небольшая биржа для фрилансеров, новые проекты появляются несколько раз в неделю.
  • Makesale.ru - новая биржа труда с гарантированной оплатой. В основном проекты по работе с текстами и постингом.
Сайты тендеров и конкурсов
На подобных проектах публикуются конкурсные задания. Кто выиграет - получает приз или деньги.
  • Citycelebrity.ru - очень много интересных конкурсов от именитых компаний. Рекомендуем.
  • E-generator.ru - конкурсы для копирайтеров и неймеров. Нужно придумывать названия для товаров, компаний, сайтов, слоганы, сценарии. Победитель получает деньги.
Биржи удаленной работы для копирайтеров
  • Textsale.ru - биржа для копирайтеров. На сайте можно продать статьи по выгодным для новичков ценам.
  • Etxt.ru - биржа для копирайтеров и переводчиков. Много работы по копирайтингу и рерайтингу, но оплата небольшая.
  • Keber.ru - новая биржа труда для копирайтеров и авторов текстов. Много небольших и недорогих заказов, с которыми справятся новички копирайтинга.
  • Advego.ru - одна из популярных бирж для копирайтеров, авторов текстов, постеров. На сайте можно купить или продать статьи.
  • Ankors.ru - на бирже надо составлять анкоры (тексты ссылок). Относительно легкая работа, по заверению биржи, способна приносить около 100 долларов в месяц.
  • TextBroker.ru - популярная биржа для копирайтеров, позволяет продавать тексты по 2-6 долларов за 1000 знаков.
  • My-publication.ru - профессиональное сообщество копирайтеров, удаленная работа. Вакансии, проекты, портфолио, блоги.
  • Smart-copywriting.com - биржа для копирайтеров, интересный проект.
  • Votimenno.ru - биржа для неймеров. Суть работы - придумывать названия для компаний, имена доменов, слоганы. Бюджеты проектов обычно 500-2000 руб.
Биржи для программистов
  • 1clancer.ru - удаленная работа для специалистов 1С.
  • Voipguru.ru - биржа работ и услуг по VoIP телефонии.
Биржи для юристов и бухгалтеров
  • Urtender.ru - тендеры на юридические и бухгалтерские услуги. Заявок пока немного, зато новые появляются стабильно.
Биржи для дизайнеров, иллюстраторов
  • Ogologo.ru - биржа труда для логомейкеров и разработчиков фирменного стиля.
  • Illustrators.ru - работа для иллюстраторов, новые проекты почти каждый день.
  • Russiancreators.ru - много проектов для дизайнеров с хорошим бюджетом, рекомендуем.
Биржи для актеров, моделей, фотографов
  • Биржа для актеров и моделей - информация о кастингах для кино, сериалов, съемок.
  • Virtuzor.ru - биржа работы для артистов, художников, музыкантов и представителей других творческих профессий. Проектная работа в сфере искусств, разлечений и досуга.
  • Шотхантер.ру - сайт для фотографов-фрилансеров, здесь можно продать разнообразные фото и получить заказы на съемку.
  • Фотовидеозаявка.рф - биржа для фотографов.
Биржи для строителей, инженеров, архитекторов
  • Qik-lead.ru - биржа для строителей, дизайнеров интерьера, ремонтников и заказчиков их услуг.
  • Architector.ru - биржа для архитекторов и дизайнеров интерьера.
  • Работа для дизайнеров интерьера - разовая и постоянная работа для дизайнеров интерьера и декораторов. Новые проекты каждый день.
  • Мы дома - удаленная работа для архитекторов, дизайнеров, конструкторов, техников, специалистов инженерных систем, 3D - визуализаторов.
  • Проектанты.ру - сервис удаленной работы для инженеров.
  • Chert-master.com - каталог инженеров, работа для специалистов с техническим образованием.
  • Квартира Красиво - биржа для строителей, поиск заказов на ремонт квартир и офисов. Биржа берет комиссионные за свои услуги.
  • Биржа для дома и дачи - строительная биржа. На сайте можно найти заказчиков или строительную бригаду.
Биржи для студентов
  • Vsesdal.com - помогайте студентам выполнять работы и получайте за это деньги.
  • Help-s.ru - помогайте решать задачи, писать рефераты и зарабатывайте на этом!
Биржи в странах СНГ
  • ITFreelance.by - белорусская биржа удаленной работы, очень удобная и полезная. При регистрации Вы сразу можете пользоваться сервисом и как фрилансер, и как работодатель.
Иностранные биржи
  • Freelancer.com - одна из крупнейших западных бирж, объединяет более 3 млн. фрилансеров со всего мира. Рекомендуем.
  • Odesk.com - американская биржа с вакансиями и предложениями разовой работы от IT до бухучета. Оплата – MoneyBookers, PayPal, oDesk debit MasterCard.
  • Elance.com – одна из ведущих бирж зарубежного фриланса по онлайн работе. Предложения в области веб-дизайна, переводов, seo и др. Предоставляет оплату только за результат.
  • ScriptLance.com – известная зарубежная биржа, специализирующаяся в областях дизайна, переводов, написания текстов, программирования.
  • Projectlance.com – биржа для программистов, график- и веб-дизайнеров.
Поиск по вакансиям удаленной работы (агрегаторы проектов с бирж и сервисов удаленной работы)
  • Thepro.ru - поисковая система по вакансиям удаленной работы, размещенным на крупных сервисах типа Weblancer.net и Free-Lance.ru.
  • Ayak.ru - удобный просмотр проектов на разных биржах удаленной работы.
  • Workbreeze.com - агрегатор проектов на биржах. Довольно удобный.

Sunday, August 19, 2012

HOLOCAUST MUST GO ON

http://alexnilogov.livejournal.com/531881.html

СТАТЬЯ ИСТОРИКА ВЛАДИМИРА КАРПЦА В ГАЗЕТЕ "ЗАВТРА", ПОСВЯЩЁННУЮ РАЗВЕНЧАНИЮ МИФА О ХОЛОКОСТЕ

Мало кто знает, что ровно год назад на своем 102-м заседании Комитет ООН по правам человека принял решение, постановляющее, что преследование за "отрицание холокоста" является недопустимым для стран, подписавших в свое время Конвенцию по правам человека. Мировой печатью это решение было замолчано. Комитет заявил: "Конвенция не разрешает никакого общего запрета на выражение ошибочного мнения или неправильной интерпретации событий прошлого". (Абзац 49, CCPR/C/GC/34). Это решение касается, прежде всего, французского т.н. закона о преследовании, который был принят, в частности, против исследователя холокоста профессора Робера Фориссона. Сноски 9 и 116 определенно ссылаются на "Закон Фориссона": "Так называемые "законы о памяти" как в процессе Фориссона против Франции, номер 550/93", относительно которого написано: "Криминализация существования у лица своего собственного мнения не совместима с пунктом 1. Преследование, запугивание или стигматизация лица, в том числе арест, содержание под стражей, судебное разбирательство или лишение свободы за мнения, которых оно может придерживаться, является нарушением пункта 1 статьи 19".(текст см.http://www2.ohchr.org/english/bodies/hrc/docs/CCPR-C-GC-34_ru.doc)

http://zavtra.ru/content/view/bitva-za-istoriyu-20/

Saturday, August 11, 2012

Wednesday, August 8, 2012

Страна под «стационарным бандитом»

http://www.novayagazeta.ru/politics/53867.html


07.08.2012
Тут буквально на днях Альфред Кох, весьма тонкий автор, более известный благодаря «распродаже России», сделал очень точную запись в «Фейсбуке», заслуживающую того, чтобы ее привести полностью:
«Существует такая (довольно известная) концепция государства, которая называется «государство как стационарный бандит». Смысл этой концепции состоит в том, что государство — эта некая банда, которая захватывает власть над неким народом, живущим на определенной территории. Однажды банда обнаруживает, что она не может расширить свои владения: мешают другие банды. Тогда банда начинает эксплуатировать «свой» народ. Очень скоро она понимает, что если она эксплуатирует народ слишком жестко, то народ либо начинает вымирать, либо восстает. Экспериментально устанавливается некая разумная мера эксплуатации, когда банда забирает лишь ту часть добавленной стоимости, которая оставляет народу достаточно средств для расширенного воспроизводства. В этих условиях богатеют и банда, и народ. Таким образом банда превращается в рациональную власть. Я долго не мог понять, почему наша банда так наплевательски цинично относится к народу? Прежде всего к тем, кто эту самую добавленную стоимость производит. А заботится лишь о тех, кто так или иначе сидит на перераспределении добавленного продукта, а не на его производстве. И тут меня осенило: для власти, выбравшей в качестве концепта развития страны практически исключительно продажу извлеченного из ее недр сырья, население этой страны — лишнее. Оно не субъект, производящий добавленную стоимость, как было бы, если бы выбрали альтернативную концепцию, заключающуюся в развитии за счет роста добавленной стоимости. В выбранной сырьевой концепции население проходит по статье «затраты», или, как теперь модно говорить, — «косты». А рациональный бизнесмен «косты» сокращает. Мы мешаем нашей банде. Она едва нас терпит. Реально ей нужны лишь 2—3 млн человек, которые заняты в добыче и доставке к рынкам сбыта сырьевых товаров. А на месте остальных они бы предпочли иметь либо бесправных гастарбайтеров, либо прямо зависящих от них бюджетников и пенсионеров. Если посмотреть на поведение нашей власти-банды под этим углом, то тогда оно оказывается вполне рациональным, и ее нынешнее поведение по отношению к нам — чуть ли не верх гуманности и терпимости».


Концепция «стационарного (или «оседлого» — в отличие от «гастролирующего») бандита», разработанная знаменитым американским экономистом Манкуром Олсоном, действительно многое объясняет в поведении клана, который сейчас управляет государством. Я бы, правда, назвал этот клан сектой, потому что, помимо извлечения ренты на правах монопольного хозяина, устанавливающего правила, но на ходу их же меняющего под себя, эта группа товарищей объединена эклектичной квазирелигией. Состоит она из православного фундаментализма, антизападничества и ощущения чекистской имперской миссии (здесь мы выводим за скобки экспертов, обслуживающих власть, которые не хотят своей стране зла и борются в рамках заданных правил хотя бы за сбалансированный бюджет — чтобы не жахнулась экономическая система). В этом смысле секта имеет свою идеологию (религию) и живо напоминает другую секту — верных марксистов-ленинцев, которые начали играть роль «стационарного бандита» сразу после Гражданской войны, а затем удерживали позиции благодаря извлечению ренты (с момента разработки самотлорских месторождений). Соединение монопольной позиции «стационарного бандита», наличие ренты и квазирелигии позволяет секте всех остальных, не примкнувших к ней, считать еретиками, «неверными», «оранжистами».
Если, как показали Дуглас Норт, Джон Уоллис и Барри Вайнгаст в своей работе «Насилие и социальные порядки», в раннем Средневековье государство служило в качестве «полицейского отделения церкви», то в модели «стационарного бандита по-русски» церковь взяла на себя функции идеологического отдела государства. Она освящает так называемое «ручное управление» без стабильных институтов, которое было бы правильно назвать не «невидимой рукой» (ее существования власть допустить не может), а «грабящей рукой» (термин американских экономистов Тимоти Фрая и Андрея Шлейфера).
Происхождение нашей власти действительно описывается в терминах концепции «стационарного бандита», вошедшей во все учебники институциональной экономики. В своей книге «Власть и процветание: избавляясь от коммунистических и капиталистических диктатур», опубликованной в 2000 году уже после кончины автора, Манкур Олсон так описывал мотивацию шефа победившего клана: «У лидера бандитов, обладающего достаточным могуществом для того, чтобы контролировать и удерживать территорию, появляется стимул к тому, чтобы осесть, водрузить на себя корону и стать автократом, который поставляет населению публичные блага».
Собственно, здесь описана психология многочисленных криминальных царьков, которые перешли от бандитского контроля над регионом, областью, районом, муниципалитетом к квазиформальному, превратившись в губернаторов, глав районов и мэров. Как правило, capoditutticapi, глава всех бандитов, в той или иной административной единице, если он достаточно эффективен, действует по принципу «одного окна» — то есть представителям малого бизнеса, помимо формальных платежей, можно откатывать только одному неформальному хозяину. Других capoditutticapi сдерживает силой авторитета или просто силой. Гораздо хуже, когда непонятно, кому откатывать и кому жаловаться, если сборщики неформальных податей выстраиваются в очередь и тем самым делают бизнес нерентабельным.
Кстати, неэффективность федеральной власти в том и состоит, что, в отличие от некоторых царьков районного масштаба, она не защищает своих подданных, у которых забирает налоги и сборы и с которыми делится остатками ренты, от других бандитов. Поэтому непонятно, зачем она вообще нужна. Ведь эффективный «стационарный бандит» делает, по словам Олсона, так: «Поскольку жертвы оседлого бандита являются для него источником налогов, он запрещает убийство своих подданных и нанесение им увечий… бандит запрещает воровство кому-либо еще, кроме себя».
В другой работе (в соавторстве с Мартином Макгиром) Олсон приводит математические доказательства размера налога, который — из рациональных соображений, свойственных «стационарному бандиту», — не может быть слишком маленьким, но и слишком большим. Наша нынешняя власть тоже находится в постоянном поиске доходно-расходного баланса. При этом она сознательно поддерживает минимально возможный уровень бедности: правящий клан не может позволить народу богатеть (за счет бюджетных источников или за счет предоставления возможностей заработать самим в условиях незарегулированной экономики), потому что людям с достатком такая власть не очень нужна. (Как говорил нобелевский лауреат Амартья Сен, бедность — это не низкий доход, а дефицит возможностей.) К тому же во время выборов, которые должны сообщать «стационарному бандиту» видимость легитимности, поддержание бедности дает возможность стимулировать голосование методом подачек, обещаний, повышений пособий и пенсий и т.д. Состоятельному и состоявшемуся человеку такие подачки не нужны, и поэтому есть риск, что он не станет подтверждать легитимность человека, объявившего себя законным начальником всех начальников.
Государство в такой системе заинтересовано в бедности. Но оно же заинтересовано и в неопределенности — тем самым всякий раз подтверждая свою способность «преодолеть хаос», «навести порядок» в том беспорядке, который само и поддерживает. Поэтому такое государство вместо строительства институтов, работающих, невзирая на личности, — судов, парламентов, госуслуг и т.д. — занимается «ручным управлением», «разруливанием вопросов», которые в нормальной институциональной среде разрешаются автоматически и без взяток. Вне коррупции «стационарный бандит» существовать не может. А вместо решения проблем власть их «финансирует». И этих денег всегда мало, поэтому у нашего «стационарного бандита», несмотря на доходы от углеводородов, вечно не хватает ресурсов.
Ну и, разумеется, «стационарный бандит» не заинтересован в демократии и обратной связи. Все, что он хочет знать об обществе, — это сколько нужно денег, чтобы откупиться от бедных и как тем самым заставить их голосовать за себя. Политика здесь уже не является обменом — общественные блага в обмен на налоги (на этот счет тоже есть целая теория другого нобелевского лауреата Джеймса Бьюкенена). Она является грабежом и национализацией. Доходов и душ. За последнюю функцию отвечает РПЦ.


Смысл происходящего в стране — попытка избавиться от системы «стационарных бандитов» федерального и уездного масштабов. И яростное ответное сопротивление, при котором «стационарный бандит», вопреки логике Манкура Олсона, вынужден наносить своим подданным увечья.

Monday, August 6, 2012

xMarkup и wordTabulator Логичева http://www.rvb.ru/soft/index.html

http://www.rvb.ru/soft/index.html

Программное обеспечение

В этом разделе представлены программы и ресурсы, связанные с анализом и обработкой текста.

НаименованиеОписание
Утилита преобразования текста xMarkup

32-бит приложение для MS Windows. Утилита xMarkup предназначена для выполнение процедур строковых преобразований в множестве текстовых файлов. Вот наиболее употребимые варианты её использования:

  • генерация или редактирование навигационных гиперссылок в совокупности HTML-документов;
  • анализ и преобразование структуры и/или содержимого SGML/XML/HTML документов;
  • редактирование и заданное преобразование текстовых файлов в пакетном режиме;
  • разрезка и склейка текстовых файлов по заданным правилам;
  • анализ и обработка текста;
  • генерация скриптов.

xMarkup принадлежит к категории бесплатного программного обеспечения с открытым кодом. Консольный модуль обработки написан на языке Icon, графический интерфейс реализован с помощью Delphi 7. Возможна сборка утилиты (интерфейс командной строки) для UNIX-подобных систем изисходного кода.

Последний релиз: v3.0 (25.05.2012). Скачать

Программа анализа текстаwordTabulator

32-бит приложение для MS Windows. С помощью wordTabulator вы можете сформировать индекс элементов, встречающихся в заданном множестве текстов. В качестве искомых элементов могут быть словоформыN-граммы (словосочетания заданной размерности) или фразы (синтагмы). Программа может обрабатывать тексты как в обычной двух-байтовой ASCII кодировке, так и в многобайтовой UTF-8. Изначально программа разрабатывалась исключительно для русскоязычных текстов, однако может быть успешно использована и для других языков (например, украинского, исландского, шведского и др.).

Программа правильно обрабатывает кириллицу с учетом упраздненных букв русского языка І, Ї (и), Ѣ (ять), Ѳ (фита), Ѵ (ижица), выстраивая словоформы в алфавитном порядке, который был принят до реформы 1918 г. Программа правильно обрабатывает и сортирует диакритические символы западноевропейского и восточноевропейского диапазонов. А текст в UTF-8 может содержать вообще любые разрешенные символы (хоть арабскую вязь или китайские иероглифы; однако эти символы сортируются только по значению уникода).

Входные тексты задаются совокупностью обычных текстовых файлов или документов в формате HTML/XML/SGML. В последнем случае программа умеет отделять полезный контент от используемой разметки. Более того, можно обработать только определенный контент, находящийся внутри заданных тегов. Или наоборот пропустить этот контент при обработке.

Дополнительной возможностью является анализ двух совокупностей текстов, которые можно сравнивать на общность или различие по составу исследуемых элементов.

Для русскоязычных текстов анализ может быть ограничен заданным списком слов в нормальной форме, которые ищутся с учетом морфологии русского языка во всех падежных окончаниях. Поиск необходимых элементов может также задаваться с помощью регулярных выражений.

Выходным результатом программы является файл (или файлы), содержащий индекс найденных текстовых элементов. Этот индекс может быть в формате HTML, с указанием для каждого элемента частоты встречаемости и ссылок на исходный контекст, или в виде простого списка в обычном текстовом файле. Список может быть упорядочен в алфавитном порядке, по значению или по частоте встречаемости элементов.

Теоретически на размеры обрабатываемой совокупности текстов никаких ограничений не накладывается. Все дело в требуемом на обработку времени. Например, собрание сочинений Ф.М.Достоевского в 15 томах на обычном настольном компьютере Pentium Dual Core 2.8 ГГц с 2 Гб оперативной памяти обрабатывается за 8 минут. Исходные тексты занимают на диске около 60 Мб, а размер выходного индекса составляет около 200 тысяч словоформ.

wordTabulator принадлежит к категории бесплатного программного обеспечения с открытым кодом. Консольный модуль обработки написан на языкеIcon, графический интерфейс реализован с помощью Delphi 7.

Последний релиз: v3.5 (28 марта 2012 г.). Скачать

Каталог лингвистических программ и ресурсов в Cети Содержит описание различных программ, связанных с анализом текстов и вычислительной лингвистикой, а также соответствующих интернет-ресурсов. Последний релиз: выпуск №9 (10.10.2006)

 



Каталог лингвистических программ и ресурсов в Cети

http://www.rvb.ru/soft/catalogue/index.html

Каталог лингвистических программ и ресурсов в Cети
Новые поступления в каталог помечаются отметкой New!, а обновления описаний отметкой Update!.
"Умершие" описания остаются в исходном тексте как комментарии, поэтому их не видно на экране, но при желании можно прочесть, загрузив страничку каталога в любой редактор.

Программы анализа и лингвистической обработки текстов

НазваниеАвтор(ы), ОрганизацияКомментарий
Link Grammar ParserJohn Lafferty
Daniel Sleator
Davy Temperley
Carnegi Melon University, USA
Link Grammar Parser – это синтаксический парсер английского языка. Работает со словарем, включающем около  60000 словарных форм. Реализован на C для Unix. Есть также версия для Windows API32. Имеет консольный интерфейс.
Исходные предложения для разбора могут вводиться вручную с клавиатуры или задаваться в ASCII-файле для пакетной обработки. Программа распространяется бесплатно.
Проекты Cíbola/OleadaComputing Research Laboratory (CLR)
New-Mexico State University, USA
Проекты Cíbola/Oleada реализуют обширные компьютерные системы лингвистического анализа текстов, представленных в Unicode. Компоненты системы включают средства работы с мультиязыковыми текстами (MUTT), построения конкорданса (XConcord) для текстов на более чем 16 языках, статистического анализа, автоматического перевода, различные словари и тезаурусы. Некоторые версии этих компонентов доступны для бесплатной загрузки после процедуры формальной регистрации. Все компоненты реализованы в среде X11 Window System для SunOs и Solaris.
Russian Morphological Dictionary Sergey SikorskyПрограмма для синтаксического и морфологического анализа русскоязычных текстов. Работает с входным ASCII-текстом. Используется морфологический словарь, включающий 120000 слов. Реализована на SWI-Prolog для Windows.
Программа распространяется бесплатно.
MystemИлья Сегалович,
Виталий Титов
компания Яndex
Компактный, очень быстрый и бесплатный морфологический парсер русскоязычных текстов, реализованный на основе словаря Зализняка. Доступны для загрузки версии для Windows и Linux. Работает как консольное приложение и имеет различные режимы представления результатов.
ЛингвоанализаторД.В.ХмелевOn-line версия программы математического анализа структуры текста. Целью анализа является определение близости любого из предлагаемых пользователем текстов к одному из авторских эталонов, определенных заранее. (Авторский эталон - это набор текстов данного автора, взятый из ресурсов Русской Фантастики). Программа анализирует входной текст и выдает имена трех писателей, которые могли бы быть его наиболее вероятными авторами. Кроме этого, программа находит три произведения каждого из авторов, которые наиболее близки данному тексту.
Программные продукты фирмы LingSoftLingSoft, ФинляндияКомпоненты грамматического разбора, морфологического анализа и лемматизации (нормализации) для английского, немецкого, финского, датского, норвежского, шведского, эстонского и русского языков. Это коммерческие продукты, которые могут быть использованы при разработке других систем.
Система StarLingС.А.СтаростинСУБД StarLing, позволяющая работать с мультиязычными текстами большой длины, с транскрипционными знаками, с удобным поиском, с анализом и синтезом словоформ по словарю Зализняка, с переводом по словарю Мюллера. Есть функции для сравнительно-исторических исследований (глоттохронология). Для загрузки доступны полные DOS и Windows версии системы. Для обеих версий системы требуется предустановка системных фонтов, также доступных для загрузки (DOSWindows).
Кроме этого можно загрузить словари Ожегова и Зализняка в DBF-формате.
В режиме on-line на сайте доступна этимологическая база для различных языков.
Морфологический анализаторС.А.Старостин On-line версия программы морофлогического анализа слов русского/английского языков. Позволяет получить для вводимого слова базовую форму и морфологическую информацию. Программа реализована на основе словарей Зализняка (рус.яз.) и Мюллера (англ.яз.).
MonoConc/ParaConcMichael Barlow
Dept of Linguistics, Rice University, Texas, USA
Коммерческие программы построения различных конкордансов, в том числе и мультиязычных. Имеется возможность загрузки бесплатных демо-версий, которые имеют ряд ограничений в сравнении с реальными версиями.
WordSmith Tools© Mike Scott 2010
School of English, University of Liverpool
WordSmith Tools - это многофункциональный программный комплекс для исследования поведения слов в текстах. Компонент WordList позволяет построить список отдельных слов или кластеров слов, упорядоченных по алфавиту или частоте. Компонент Concord используется для построения конкордансов. Компонент KeyWords позволяет построить список ключевых слов. Имеется настройка на тип языка в обрабатываемых текстах. Исходные тексты могут быть представлен в различных форматах, включая PDF, MS Word, HTML, XML или SGML.
Работает на платформах Windows 2K и старше, 32 или 64-битных версий. Для скачивания доступна бесплатная демо-версия.
TextAnalyst 2.0 Научно-производственный инновационный центр "МикроСистемы" Демо-версия очень интересного инструмента анализа символьных текстов. Позволяет построить семантическую сеть понятий, выделенных в обрабатываемом тексте, со ссылками на контекст. Имеется возможность смыслового поиска фрагментов текста с учетом скрытых в тексте смысловых связей со словами запроса. Позволяет анализировать текст путем построения иерархического дерева тем/подтем, затрагиваемых в тексте. Также имеется возможность реферирования текста.
Кроме отдельного продукта TextAnalyst также предлагается инструментарий разработчика TextAnalyst SDK, включающий функции лемматизации (приведения слов к нормальной форме) для русского и английского языков, построения частотных списков понятий, поиска слов в контексте и т.д.
Еще одна комонента, TextAnalyst Lib, может использоваться для пострения гипертекстовых электронных книг.
Все компоненты реализованы для Windows 95 и выше и доступны для бесплатной загрузки. Интересно отметить, что на американском рынке технологию TextAnalyst продвигает фирма Megaputer Intelligence Inc.
Galaktika-ZOOMкорпорация Галактика, МоскваАвтоматизированная система поиска и аналитической обработки информации. Мощный инструмент анализа и обработки текста (Text Mining), позволяющий извлекать необходимые сведения из огромного объема данных. Это коммерческая система, имеющая клиентов в рекламе, органах управления и средствах массовой информации.
Лингвистические компоненты, словари и библиотеки классовАндрей КоваленкоАвторская страничка ведущего разработчика компании Рэмблер А.Коваленко, на которой представлены его лингвистические разработки, реализованные в ряде существующих информационно-поисковых систем - Апорт!РэмблерМета, системе Пропись 4.0 и других. Можно скачать описания и демо-версии компонентов.
netXtractRelevant Software Inc.Замечательная компонента, подключаемая к Microsoft Internet Explorer (версии 5.0 и выше), которая позволяет в мгновение ока получить упорядоченный индекс слов в загруженном HTML документе. Индекс может быть упорядочен по алфавиту или частоте. Для каждого слова в индексе можно исследовать контекст, в котором это слово встречается. Выбранные слова по желанию заносятся в персональную базу знаний, которая позволяет систематизировать найденные документы удобным образом. Можно скачать бесплатную версию.
Textual Analysis Computing Tools (TACT) Library Electronic Text Resource Service
Indiana University, USA
Пакет программ обработки ASCII текстов, разработанный группой исследователей из Университета в Торонто. Пакет включает программы для автоматизированной разметки текста; построения упорядоченных списков слов; анализа распределения слов в тексте по длине и частоте; построения конкорданса и другие. К сожалению все программы старые и сделаны для DOS. Однако, имеется on-line версия пакета TACTWeb 1.0
Paai's text utilitiesDr. J.J. Paijmans, НидерландыСборник различных утилит и Unix-скриптов для обработки ASCII-текстов. Все программы скомпилированы для использования в Linux.
WordTabulator v2.2.3Логичев С.В., 1997-2004Программа анализа текстов в среде Windows 9x/NT/2000/XP. Позволяет построить упорядоченные индексы словоформ или словосочетаний заданной размерности для множества входных текстов в ASCII-формате или HTML. Поддерживает основные кириллические кодировки. Возможность поиска с использованием символов маскирования. Имеет встроенный морфологический модуль, позволяюший искать все видоизменения русских слов, заданных базовой формой. Позволяет осушествлять контекстный просмотр результатов, представленных в виде гипертекстового индекса. Возможность анализа двух текстовых корпусов на сходство или различие. Freeware!
ХудломерЛеонид ДелицынХудломер - это метод автоматической классификации функционального стиля текста на основе спектров длин слов. Программа, реализующая классификацию, написана на языке JavaScript (первоначальная версия была на Perl) и доступна on-line. Программа определяет следующие стили: разговорный стиль, стиль художественной литературы, газетно-информационный стиль, научно-деловой стиль. Автор Худломера - президент конкурса русской сетевой литературы ТЕНЕТА-РИНЕТ'2000, Леонид Делицин.
Свежий взгляд/Fresh Eye
версия 1.21, 1995
Дмитрий КирсановDOS-утилита, реализующая стилистическую проверку русскоязычных текстов. Программа отыскивает в тексте места, где фонетически и морфологически схожие слова расположены в непосредственной близости, что порождает так называемую паронимиюили "нечаянную тавтологию". Программа распространяется без каких-либо ограничений вместе с исходным текстом на C. Есть версия для OS/2.
URS версия 1.1
от 05.04.2001
М.А.Бендерский,
компания"НООЛаб", Новосибирск
Unique Record Set Management utility, Win9x/NT/2000. Утилита для построения и обработки словарных частотных индексов. Позволяет обрабатывать входные документы в форматах обычного текста, HTML и MS Word. Возможности анализа и обработки пар словарных индексов как двух множеств. Экспорт результатов в выходной файл.
WordStatДубинский А.Г., 2001Бесплатная утилита подсчета частоты встречаемости различных слов в текстовых или html-файлах. Понимает основные русские кодировки, игнорирует html-разметку.
Алгоритм сравнения текстовВладимир ЧаплинскийОписан простой алгоритм сравнения двух текстов и даны примеры программ на FoxPro. Автор использует данный алгоритм для поиска дубликатов анектодов в своей личной коллекции.
АОТ (автоматическая обработка текста)Алексей СокиркоСайт, на котором представлены разработки рабочей группы специалистов в области автоматической обработки текста. Среди предлагаемых продуктов:
- модуль графематического анализа текста;
- компоненты морфологического анализа для русск., нем. и англ.яз.;
- модуль автоматического уничтожения омонимии;
- модуль семантического анализа текста;
- система лингвистического поиска (конкорданс);
- различные тезаурусы и словники.
Для загрузки доступны freeware версии для Linux и Windows. Исходные коды для Linux доступны на условиях лицензии LGPL.
Технологии анализа и поиска текстовой информацииRCO Сайт, на котором представлены разработки московской компании Russian Context Optimizer (info@rco.ru). Cреди представленных технологий:
- анализ и классификация текстов, автоматическое реферирование;
- полнотекстовый поиск для Oracle и SQL Server;
- морфологичекий, синтаксический и семантический анализ текста;
- средства навигации по большим массивам текстов;
- научные публикации авторов проекта.
Textarc© W. Bradford Paley, Digital Image Design Inc. 2002Революционная программа для визуализации и исследования текстов, являющаяся настоящим произведением искусства. Текст воспроизводится на экране компьютера в виде галактики, в которой слова играют роль звезд. Часто встречающиеся слова светятся ярко, а редкие - вовсе не видны. Строки текста выводятся в виде закручивающейся спирали по границе "галактики" точечным шрифтом (высотой в один пиксель). Программа позволяет видеть структуру текста, взаимосвязи между словами и контекстом, просматривать частотный и алфавитный индекс слов и конкорданс. При движении курсора по галактике слова вспыхивают и загораются лучами (указателями на контекст) и еще звучат в разной тональности. Программа реализована как Java-апплет для броузера.
MCR DLL v2.0DimМорфологический модуль в виде DLL-библиотеки, позволяющий осуществлять лемматизацию и морфорлогический анализ для слов русского языка. Работает с морфологическим словарем, построенным на базе словаря Зализняка. Поддерживает функции создания, обновления и работы с дополнительными пользовательскими словарями. Модуль написан на MS Visual C++ и доступен для загрузки с авторского сайта. Freeware!
Ngram Statistics Package (NSP)Ted Pedersen
© 2000-2004
Пакет NSP позволяет идентифицировать в больших корпусах текстов словесные n-граммы с использованием стандартных статистических критериев, таких как тест Фишера на равенство, отношение логарифма вероятности и тест Пирсона хи-квадрат. Позволяет легко задавать дополнительные критерии проверки. NSP написан на языке Perl. Исходный текст распространяется на условиях GNU Copyleft.
Лемматизатор МультитранМультитранЛемматизатор, реализующий возможности морфологического модуля системы Мультитран. Загружаемый архив lemm.zip содержит исходный код проекта для MS Visual C++ и словарную базу системы, содержащую около 300.000 основ и 15.000 окончаний для русского языка. Позволяет искать все базовые формы введенного слова с показом его грамматических характеристик.
FRQDictW.exeАлександр Челмодеев
http://ichip.chat.ru
fido: 2:5062/17.5
Программа построения частотного словаря для заданного текста. Теоретически может работать с любыми файлами, содержащими ASCII-текст в кодировке Win-1251. Работает в ОС Windows 9x/ME/NT/XP как консольное приложение.
RhymesНиколай Кецарис
© 2002-2003
Замечательная программа поиска рифм на основе "Грамматического словаря" А.А.Зализняка. При поиске выполняет фонетическое сравнение слов с учетом ударения. Позволяет находить для заданного слова синонимы и антонимы. Общий размер словарной базы Rhymes составляет 100 тыс. слов и 1.7 млн. словоформ. Версии для Windows и Pocket PC. Freeware!
Russian Link Grammar ParserСергей ПротасовOn-line парсер русского языка, использующий при разборе предложений Грамматику Связей (Link Grammar). Результатом работы парсера является граф, в котором слова предложения связаны между собой связями. Эти связи позволяют корректно определить морфологические признаки слов в предложении и разрешить возникающую омонимию. Парсер реализован на C и Perl для Unix.
Синтаксический анализатор естественного текста на русском языке Ермолаев Дмитрий СергеевичСинтаксический анализатор естественного текста на русском языке обрабатывает предложения с большим количеством слов (100 и более). При этом ошибочность разбора оценивается как 20% от общего числа связей, связываемость слов в предложении составляет около 70% от общего числа связей.
СклонятельСергей СлеповПрограмма "Склонятель" предназначена для склонения слов и словосочетаний на русском языке. Она может быть использована для автоматизации делопроизводства, например, для склонения наименований должностей, предприятий, изделий, материалов и так далее. Программа реализована в виде модуля (библиотеки) для различных платформ - .NET, Win32, FreeBSD.
Forson, a sentence generation toolAlfonso TarantiniПрограмма генерации синтаксически корректных предложений. Программа управляется входным файлом правил на основе грамматики Bison, что обеспечивает выборочный илм полный контроль предложений. Программа может использоваться для тестирования компиляторов и парсеров или дидактических целей. Реализована для POSIX (Linux/BSD/UNIX-клоны) и Linux операционных систем.
LeoBilinguaЛеонид БродскийБесплатная программа, позволяющая генерировать билингва-текст (текст из двух синхронных половинок на разных языках).
Инструментальные средства МедиаЛигва© МедиаЛингва, МоскваИнструментальные средства московской компании МедиаЛингва, предназначенные для создания систем автоматического аннотирования, классифицирования, поиска и морфологической обработки текстовой информации.
Apache OpenNLPThe Apache Software Foundation, IncubatorOpenNLP - это организационный центр "open source" проектов, связанных с машинной обработкой естественного языка под эгидой Apache. OpenNLP предлагает обширный Java-инструментарий обработки текстов на основе методов машинного обучения. Он включает средства токенизации, выделения предложений, разметки частей речи, выделения имен собственных, разбора текста и разрешения перекрестных ссылок. Имеется документация на английском языке. Для скачивания доступен исходный код и бинарные компоненты (для запуска требуется установка Java VM).


Программы преобразования текстов

НазваниеАвтор(ы), ОрганизацияКомментарий
HTML Batch Editor © LucersoftКомпактная утилита для Windows, позволяющая осуществлять пакетные преобразования массивов текстовых или html-файлов с помощью набора заданных шаблонов. Программа может быть бесплатно загружена с сайта.
СловогрызИван СагалаевСловогрыз - это бесплатная утилита для Windows, которая предназначена для поиска и замены текста по заданным маскам. Программа умеет находить и заменять в тексте не только строго заданные слова и фразы, но и текстовые элементы, определяемые произвольными поисковыми шаблонами. Позволяет сохранять/загружать сценарии преобразований.
ClearText Reader's Edition Дмитрий ГрибовFreeware программа для переформатирования текстовых или html-файлов (Windows). Позволяет осуществлять как вычистку разметки, так и ее добавление. Понятный графический интерфейс, автораспознавание кодировки.
xReplacer©XDW Soft, 2000-2004Условно-бесплатная программа для Windows, позволяющая производить массовые операции поиска и замены в множестве текстовых файлов. В качестве поисковых шаблонов можно использовать регулярные выражения. Понимает до 12 различных кодировок, состав которых может быть расширен пользователем.
xMarkup v2.1.1© Логичев С.В., 1999-2008Бесплатная программа, предназначенная для выполнения сколь угодно сложных преобразований над множеством текстовых файлов. Платформа: 32-bit Windows 9x/NT/2000/XP/2003. Позволяет анализировать, изменять, создавать и удалять заданные элементы обрабатываемых текстов. Поддерживает встроенный язык обработки в форме упрощенного диалекта языка Icon.
Xchange Search&Replace© SadMan Software, 2000-2006Xchange - это утилита для Windows, позволяющая осуществлять пакетные преобразования в множестве текстовых файлов.
XML редакторы Thijs van den Broek, 2004Описание раздичных программ (со ссылками) для редактирования XML-данных (на англ.языке).
KDiff3Joachim EiblБесплатная программа для Windows, позволяющая визуально сравнивать текстовые файлы.
WinMerge WinMerge projectБесплатная программа для Windows, позволяющая визуально сравнивать текстовые файлы.
TextTransformer v1.4.1© Dr. Detlef Meyer-Eltz, 2002-2008Мощная программа, предназначенная для выполнения сколь угодно сложных преобразований над множеством текстовых файлов. Платформа: 32-bit Windows. Позволяет анализировать, изменять, создавать и удалять заданные элементы обрабатываемых текстов. Описание сценария обработки текста осуществляется в синтаксисе C++. Фактически, конечная программа обработки реализуется как специализированный парсер исходного текста. В профессиональной версии есть возможность генерации исходного C++ кода для конкретного сценария обработки.


Психолингвистические программы

НазваниеАвтор(ы), ОрганизацияКомментарий
ПСИ-Офис версия 2.1 Вадим СысуевСистема психолингвистического анализа текстов, включающая 3 компоненты:
 - программа поиска вложенных слов в тексте, т.е. слов, "спрятанных" внутри и на переходах между словами.
 - программа поиска повторяющихся фрагментов текста при анализе "автоматического письма" (такие тексты пишутся с целью анализа текущих подсознательных процессов).
 - программа синтеза подсознательного компонента текста.
Поддержка русского (словарь 690 тыс.слов) и английского (словарь 430 тыс.слов) языков. Возможность подключения дополнительных словарей. Работает в Windows 9x/2000/NT. Freeware.
ВААЛ-2000Проект ВААЛПсихолингвистическая экспертная система лексического и контент-анализа текстов. Основные задачи - прогноз эффекта неосознаваемого воздействия текста на массовую аудиторию, анализ текстов с точки зрения такого воздействия, генерация текста с заданным вектором воздействия, выявление личностно-психологических качеств автора текста. Система реализована в виде набора DLL-библиотек, которые подключаются к текстовому процессору Word для Windows. Успешно используется в ГосДуме, правительстве, крупных банках и PR-компаниях. Для бесплатной загрузки доступна облегченная версия системы ВААЛ-мини.
ПРИЕМЫ ЖУРНАЛИСТИКИ & PUBLIC RELATIONS,
версия 2.03, 2000
Система "ТРИЗ-ШАНС", Санкт ПетербургКоммерческая программа, представляющая собой консультанта, помогающего Пользователю при написании различных текстов. Пользователь выбирает ряд параметров, характеризующих желаемый результат, а программа выдает ему рекомендации по написанию текста и иллюстрирует их примерами. В основе программы - анализ 12500 текстов мастеров русского языка, начиная от писателей-классиков и заканчивая современными журналистами и политиками. К сожалению в программе отсутствуют возможности анализа написанного Пользователем текста.
Для загрузки доступна демо-версия, являющаяся облегченным вариантом профессиональной версии. Демо-версия также включает руководство пользователя и демонстрационный обучающий ролик. Программа требует для работы русские Windows 9x/2000/NT и Microsoft Word.
Psyberia.ruВит ЦенёвКаталог компьютерных программ на сайте проекта "Продвинутая Пихология". Каталог включает следующие разделы: психологические тесты, психологические тренинги и игры, программы для наблюдения биоритмов, психолингвистические программы, психологические справочники и базы данных.
Лаборатория ПСИТОН© Psyton Inc., 2006Профессиональные психодиагностические программы для WINDOWS 9X/Ме/XP (коммерческие).


Генераторы текстов

НазваниеАвтор(ы), ОрганизацияКомментарий
Russian Word Constructor(RWC)
версия 1.0, 1992
Дмитрий КирсановЭкспериментальная программа для генерации русскоязычных стихоподобных текстов ("инструмент поэта"). Программа способна конструировать русские неологизмы на основе заданного словаря с лексико-статистической информацией. Несмотря на свою "древность", программа интересная и может позабавить своими словесными изобретениями. Прилагается утилита для создания авторских рабочих словарей. Распространяется бесплатно. Есть исходные тексты на языке C. Работает как консольное приложение MS-DOS.
Дацюк(ТМ)
Робот Сергей
© E}-|-{E, 1997-2002"Самый виртуальный Виртуал русского Интернета". On-line генератор "осмысленных" текстов заданной длины. Я бы назвал произведения робота шизофреническим бредом сексуально-философской направленности. Однако бывает весьма любопытно почитать. По стилю презентации проекта и его духу, он мне напоминает феерическую фантасмагорию в лучших традициях Станислава Лема.
Scott Pakin's automatic complaint-letter generator Scott PakinВсемирно известный генератор письменных жалоб Скотта Пейкина. Представляет собой on-line версию программы генерация текста жалобы на заданную персону или организацию. Использует для работы словарь лексической информации, который на сегодняшний день включает более 7000 элементов. Язык реализации - английский.
A.L.I.C.EDr. Richard S. WallaceA.L.I.C.E. - сокращение от Artificial Linguistic Internet Computer Entity (Искусственная Лингвистическая Интернет Компьютерная Сущность) - это сайт, посвященный разработке и продвижению в массы технологии AIML и говорящего робота (или бота) Alice, трижды выигрывшего поединок на приз Лобнера (Loebner prize). ALICE развивается как open-source проект под эгидой некоммерческой организации ALICE AI Foundation, зарегистрированной в США. В основе технологии, на которую опирается ALICE, лежит использование AIML (специализированного языка разметки для искусственного интеллекта). В разделе downloads доступен исходный код и различные имплементации программы.
The Dada EngineAndrew C. BulhaГенератор случайных текстов на основе заданной грамматики (англ.яз.). Работает на UNIX-подобных системах, можно загрузить исходный код. На основе The Dada Engine реализована on-line версия Генератора Постмодернистских Текстов.
ВеснаЕлена Савельевна КолмановскаяOn-line генератор псевдо-философских текстов, созданный главным редактором компании Яndex.
BotSpot© INT Media Group, 2001 Исчерпывающий каталог всевозможных программных ботов, существующих во всемирной сети (англ.яз.). Есть даже ссылка на проект создания виртуальной личности Джона Леннона.
ANANOVAAnanova Limited
United Kingdom
Новостное агенство в Великобритании, использующее на своем сайте виртуального анимированного диктора. Т.е. симпатичная виртуальная девушка, сверкая глазками и шевеля губками, синтезированным голосом рассказывает вам о последних новостях (естественно, на английском языке).
Chatterbot CentralSimon LavenЗоопарк ботов всевозможных мастей и видов. Здесь, похоже, собрана вообще вся информация о говорящих программах, существующих сегодня в сети. Начиная c классики (например, всемирно известной Элизы доктора Фейгенбаума) и кончая самыми последними разработками с использованием языка искусственно-интеллектуальной разметки (AIML).
Аки Росс 1.0© Альберт Товмасян, 2002Интеллектуальная программа естественно-языкового общения на русском языке. Специальный plug-in позволяет использовать анимацию в виде очаровательной девушки-собеседника по имени Аки Росс (так звали героиню компьютерного мультика Final Fantasy). База знаний программы не столь обширная, но теоретически ее можно улучшать и дополнять (используется язык разметки AIML). Сайт разработчика программы "умер", поэтому ее можно найти только в архивах.
Ainte-Генераторы текстовКарандашев ЯрославНа авторском сайте "Ainte" представлена коллекция различных генераторов текста.
МистикаWebmedia.Ru
© 2000-2004
Робот-Оракул, порождающий тексты мистической тематики.
Болтунboltun@pisem.net.nospamБолтун - это виртуальный собеседник, который обладает зачатками искусственного разума. Благодаря этому он может реагировать на реплику пользователя своей репликой. В общем, это freeware русский бот. Кроме Болтуна доступны для ознакомления и использования другие программы.
Растрепанный Блокнот© Инга КессКоллекция программ-собеседников на сайте Растрепанный Блокнот.


Системы обработки естественного языка и машинного перевода

НазваниеАвтор(ы), ОрганизацияКомментарий
Natural Language Projects at ISI © Univ.of Southern California/Information Science Inst., 1999-2001Описание группы проектов по вычислительной лингвистике и машинному переводу, выполняемых в Университете Южной Калифорнии.
Webclopedia - проект, связанный с созданием информационных агентов, способных генерировать ответы пользователю на основе анализа разнородных коллекций ресурсов, доступных в сети.
ONTOSAURUS - это онтологический тезаурус, включающий 90,000 концептуальных сущностей (словарная база взята из проекта WordNet).
SUMMARIST - мультиязычная система реферирования текстовой информации.
ReWrite - система двуязычного перевода, основанная на статистическом анализе пар текстовых корпусов.
Автоматический словарь Мультитранpom@aha.ru
© 2001-2004
Система автоматического перевода, поддерживающая русский, английский, немецкий, французский и испанский языки. Содержит более пяти миллионов терминов и предоставляет возможности алфавитного, морфологического и фразового поиска.
Translate.RuООО ПРОМТ
© 2000-2004
Портал on-line перевода компании ПРОМТ. Поддерживает русский, английский, немецкий, французский, итальянский и испанский языки.
LEODepartment of Informatics, Technische Universitat, Munchen Система англо-немецкого перевода и словарь, содержащий более 3300000 словарных статей.
PEREVODOV.net Ectaco
© 1990-2004
Система on-line перевода компании Ectaco, специализирующейся на разработке электронных карманных переводчиков. Поддерживает русский, немецкий и французский языки.
Проекты НИИ ИИРоссийский НИИ Искуственного ИнтеллектаОписан ряд проектов (Alex, AURA, InBASE, InDoc), реализующих технологии обработки естественного языка в задачах извлечения знаний, поиска, автоматического реферирования для массивов текстов.
Computer Aided Translation Google.comРаздел Google, содержащий ссылки на различные системы машинного перевода.
Google Переводчик© 2008 GoogleСервис Google, предлагающий on-line перевод текста или Web-страничек. Поддерживает попарный перевод с 23 различных языков, включая все основные европейские языки и русский.


Коллекции ресурсов

НазваниеАвтор(ы), ОрганизацияКомментарий
Каталог программ по вычислительной лингвистике
SIL International (Summer Institute of Linguistics)
Обширный каталог программ по вычислительной лингвистике, разработанных в рамках проекта SIL. Представленные в каталоге программы носят явно академический характер и требуют значительных усилий для изучения и применения. Не рекомендуются неискушенным в академической лингвистике пользователям. Все программы, а их более 60, являются бесплатными и доступны для online загрузки. Есть исходные коды.
Каталог программ по вычислительной лингвистике в сети InternetSIL InternationalОчень обширная коллекция ссылок на программы чрезвычайно широкой лингвистической направленности в сети Internet. Для всех платформ. Но совсем нет программ, посвященных русскому языку. Представлены как бесплатные так и коммерческие программы.
Ресурсы, связанные с анализом текстовMatthias RomppelЭлектронный каталог ресурсов, связанных с анализом текстов (на англ.языке). Библиографии, программное обеспечение, адреса исследовательских организаций, архивы электронных текстов и другое.
Справочно-информационный портал "Русский язык" © МО "ЭЛЕКС", 2000Замечательный ресурс для истинных любителей русской словесности, содержащий массу полезной иноформации. Также включает on-line словари русского языка:
 - Полный электронный орфографический словарь русского языка под ред. В.В. Лопатина.
 - Словарь трудностей произношения и ударения в современном русском языке.
 - Новый словарь русского языка. Толково-словообразовательный.
 - Русское словесное ударение. Словарь нарицательных имён.
 - Русское словесное ударение. Словарь имён собственных.
На сайте опубликован исчерпывающий указатель ссылок на интернет-ресурсы, посвященные русскому языку и литературе.
Text Analysis Info© Harald Klein, Social Science Consulting, GermanyText Analysis Info - это бесплатный информационный портал, посвященный анализу контента межчеловеческого общения (в основном текстов). Также представлены различные программы, предназначенные для обработки таких источников как аудио-, видео- или речевых данных.
The Linguist List Eastern Michigan University
Wayne State University
Большой каталог программного обеспечения для различных областей компьютерной обработки текстов и лингвистики.
LTI Projects Language Technology Institute at Carnegie Mellon UniversityКаталог проектов, посвященных созданию систем машинного перевода, обработки речи, информационного поиска, извлечения знаний и других.


Словари и тезаурусы

НазваниеАвтор(ы), ОрганизацияКомментарий
ФЭБ словари ФЭБ "Русская литература и фольклор"Энциклопедии, словари и справочные пособия на сайте Фундаментальной Электронной Библиотеки (ФЭБ).
Каталог сетевых ресурсов по русской филологии и фольклору К.В. Вигурский, И.А.Пильщиков, К. ХокинсКаталог ссылок на электронные библиотеки русской литературы и сетевые проекты, посвященные русской филологии и фольклору.
Словарь В.ДаляOn-line версия знаменитого словаря В.Даля "Толковый словарь живого великорусского языка". Оригинальный текст © В.И.Даль, 1880-1882. Адаптация к современному языку и издание © Изд. "Цитадель", г. Москва, 1998 г.
Словарь устаревших и диалектных слов© Центральный Телеграф, 1998-2001Небольшой словарик устаревших слов русского языка на сервере Центрального телеграфа.
On-line словари Издательского Дома "ЭТС"© 1997-2000 ETS Publishing HouseКоллекция on-line словарей: анатомический (латынь), уфологический, сокращений, иностранных слов, финско-русский, немецко-русский, англо-русский фразеологический и ряд других. Кроме этого на сайте представлены различные словари Polyglossum и языковые программы.
Словари Ожегова и Зализняка С.А.СтаростинOn-line версии словарей Ожегова и Зализняка.
Лексикон "Дар слова"Эпштейн Михаил Наумович Сетевой проект известного филолога, философа и культуролога Михаила Эпштейна, стартовавший в апреле 2000. Проект связан с изучением феномена однословия, т.е. слова как самоценной сущности. Представляет собой сетевой еженедельник, публикующий эссе по словобразованиям и неологизмам русского языка. Каждую неделю подписчикам высылается одно или несколько новых слов, с дефиницией, толкованиями и примерами употребления. Все публикуемые слова являются уникальными словообразованиями, которых не найти ни в одном словаре русского языка.
Acronym FinderMountain Data SystemsОчень полный словарь акронимов и сокращений английского языка. Содержит более 173 тысячи элементов.
Lexical FreeNetDatamuse CorporationПродвинутый on-line тезаурус английского языка. Может использоваться для любых мыслимых целей - решения кроссвордов, поиска синонимов, связанных слов, подбора рифм, орфографической проверки и т.д.
WordNetCognitive Science Laboratory,
Princeton University
WordNet - это электронный тезаурус, отражающий все возможные толкования слов английского языка, и показывающий взаимосвязи между ними. Для каждого слова можно найти синонимы, объединенные в смысловые группы и получить ссылки на родовые (более общие) или производные понятия. Ценный ресурс для филологов, занимающихся английским языком. Можно скачать локальные версии тезаураса для UNIX, DOS и Macintosh.
The Wordsmyth Educational Dictionary-Thesaurus (WEDT)Wordsmyth CollaboratoryWeb-сайт, предлагающий on-line версию образовательного словаря-тезауруса английского языка. Содержит около 50 тысяч коренных слов. Удобные средства поиска. Пользователь может получить расклад интересующего слова по слогам, его произношение, список всех словоформ и толкование.
Толковый словарь Merriam-WebsterMerriam-Webster IncorporatedOn-line версия знаменитого толкового словаря английского языка.
American Indian Language © Customized Computer Software, 1999-2000На сайте представлены программы обучения разговорным языкам северно-американских индейцев племен лакота(сиу) и шошонов, а также компьютерный словарь языка лакота-сиу, содержащий 3300 слов с переводом на английский. Все программы бесплатные и сделаны для Windows 9x/NT. А здесь вы можете эти же ресурсы посмотреть и послушать on-line.
Babylon.comBabilon.com Ltd.Сайт, предоставляющий различные информационные услуги - мультиязычный перевод, словари и справочники, преобразование одних мер в другие и т.д. Пользователь получает доступ к ресурсам системы после установки на свою локальную машину интерфейса Babylon. Он может определять состав необходимых ему словарей, языковые настройки и режимы работы (в off-line или в on-line) и даже создавать свои собственные словари. Система Babylon имеет доступ к ресурсам таких известных провайдеров какBritannica.comDietwatch.com, и Accuweather.com. Плата за пользование не взимается!
Atomica(GuruNet)Atomica CorporationСайт, предоставляющий обширные информационные услуги, в том числе - различные энциклопедии, толковые словари, справочники и тезаурусы. Пользователь может обращаться за информацией непосредственно на сайт или через устанавливаемый на локальной машине интерфейс (загрузить).
British National Corpus (BNC)© 1995 Oxford University PressКоллекция более чем 100 миллионов слов современного английского письменного и устного языка. BNC включает в себя более 4000 различных текстов, слова которых классифицированы и размечены с использованием стандарта Text Encoding Initiative (TEI). В режиме on-line поиска пользователь может найти примеры употребления как отдельных слов, так и выражений. Зарегистрированным подписчикам BNC предоставляются услуги специальной поисковой машины SARA.
BibliomaniaBibliomania.com LtdПубличная Интернет-библиотека, включающая в том числе классические справочные издания по английскому языку:
 - Roget's Thesaurus (тезаурус Роже),
 - Brewer's Phrase and Fable (фразеологический словарь Брюера),
 - Hobson Jobson (индо-англ. этимологический словарь),
 - Soule's Synonymes (словарь синонимов Шуле),
 - Webster's Dictionary (словарь Вебстера, изд. 1913 г.)
Электронные словари MediaLingua для ПК © МедиаЛингваЭлектронные словари от компании MediaLingua для настольных ПК
Электронные словари MediaLingua для КПК © МедиаЛингваЭлектронные словари от компании MediaLingua для карманных ПК
Словарь Мультилекс® 5.0© МедиаЛингва, 1995-2006Линейка электронных мультиязычных словарей Мультилекс с возможностью on-line поиска.
ABBYY Lingvo 11© ABBYY Software House, 1996-2006Система мультиязычных электронных словарей широкой тематики для Windows. Есть возможность on-line поиска.
Электронные словари ПРОМТ © ЗАО "ПРОект МТ", 1997-2006Каталог программных продуктов и коллекция различных электронных словарей (англ., немецкий, франц., русск.) на любую тему. Все словари коммерческие.
Словарь сокращений русского языка © Студия Артемия Лебедева, 2000—2001On-line словарь сокращений русского языка, включающий на сегодня более 53000 статей. При создании ресурса были использованы следующие издания:
 - "Словарь сокращений русского языка" (1984);
 - "Новый словарь сокращений русского языка" (1995);
 - "Новые сокращения в русском языке 1996—1999" (1999).
Русский гиперсловарь Ариадна Пацкин А.И.Гиперсловарь "Ариадна" - проект создания универсальной среды для систем автоматической обработки русского текста. Основная работа проделана осенью 2001 года Пацкиным А.И. По форме гиперсловарь является базой данных Абриаль, включающей грамматическую компоненту на основе словаря А.А. Зализняка, позволяющую получать склонения и спряжения слов, и морфологическую компоненту. Программу работы со словарем можно скачать для локального использования отсюда.
СанскритМаксим МейстерБесплатная обучающая программа, позволяющая узнать азы санскрита - священного языка индийских брахманов. Совершенно не требовательна к аппаратуре и должна работать на любой Intel PC. Здесь же выложены шрифты для санскрита.

Словари и энциклопедии для карманного ПК
www.epoc.nm.ruРяд словарей и энциклопедий в формате для карманного ПК.
Русские словариИнститут Русского Языка им. В. В. Виноградова Российской Академии Наук и издательство "АЗБУКОВНИК"on-line словари русского языка:
 - Толковый словарь русского языка С. И. Ожегова и Н. Ю. Шведовой,
 - Русский орфографический словарь,
 - Популярный словарь иностранных слов,
 - Словарь иностранных слов,
 - Русский семантический словарь,
 - Словарь языка Пушкина,
 - Словарь русских синонимов и сходных по смыслу выражений,
 - Словарь русского арго,
 - Словарь русских личных имен,
 - Словарь языка Достоевского.
Словари на RIN.ru Российская Информационная СистемаКоллекция on-line словарей, в том числе толковых, энциклопедических, языковых.
Словарь русского языка системы ASIS Тришин В.Н.Электронный словарь русского языка, содержащий более 280 тысяч слов. Для большей части словарных единиц приводятся синонимы и слова, близкие по смыслу. Словарь может быть свободно загружен. Предназначен для работы в Windows 9x/2000.
БОКР (Большой Корпус русского языка)С.А.Шаров, 2002Проект по созданию представительного корпуса русского языка, который содержал бы примеры различных речевых жанров и типов текстов, используемых в русском языке в настоящее время. Предполагаемый объем корпуса 100 млн. слов.
Национальный корпус русского языкаНациональный корпус русского языка, 2003-2006Корпус русского языка — это информационно-справочная система, основанная на собрании русских текстов в электронной форме объемом 120 млн. слов. On-line поиск по корпусу реализован с помощью технологии Яндекс.Server.
Glossary CommanderМБА «Вэб-Миссия»Служба тематических толковых словарей Глоссарий. Содержит большое количество толковых специализированных словарей.
CRECLECOPatrick SeriotЭлектронная библиотека русскоязычных текстов по языкознанию периода 20-30 годов XX века. Автор является профессором славянского языкознания в Лозаннском Университете, Швейцария
canoo-netCanoo Technology AG, © 2000-2002Немецкие словари: морфологический, орфографический, склонений и словобразований.
Этимологический словарь англ.языкаDouglas Harper, © 2001 Электронная версия этимологического словаря английского языка. При составлении словаря автор использовал различные авторитетные источники, такие как "An Etymological Dictionary of Modern English", "Oxford English Dictionary" и многие другие.
Говорим по-русскиАрнольдАрхивы форума "Говорим по-русски". Также представлены ссылки на словари и другие ресурсы, интересные знатокам русского языка.
Электронные словари КОНТЕКСТООО «Информатик», 1989-2007Cистема профессиональных электронных мультиязычных словарей различной тематики. Есть возможность on-line поискаhttp://www.dics.ru/online/
Яндекс.СловариЯндекс, 2001-2006Постоянно пополняющаяся коллекция on-line словарей от Яндекс.


Поисковые машины и системы полнотекстового поиска

НазваниеАвтор(ы), ОрганизацияКомментарий
Серверный Следопыт МедиаЛингваСерверный Следопыт – это высокопроизводительная система полнотекстового поиска информации по содержимому сайта. Позволяет осуществлять нечеткий и смысловой поиск документов на русском и/или английском языках. Для каждого найденного документа генерируется содержательная аннотация.
ARM Engine 4.0© ABBYY Software House, 2001ABBYY Retrieval & Morphology (ARM) Engine - это коммерческая инструментальная система, позволяющая встраивать в разрабатываемые приложения функции полнотекстового поиска и морфологического анализа текстов. Поддерживает практически все европейские языки, включая русский. Реализована в виде API с использованием технологии COM-объектов. Демо-версию можно получить бесплатно.
NeurOK Semantic Suite© НейрОК Интелсофт, 2002Программные продукты для поиска и анализа в текстовых массивах информации, реализованные с использованием технологии нейтронных сетей. Серьезные цены, соответственно серьезности самих продуктов.
Поисковые системы ЯndexЯндекс
© 1997-2004
Набор средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского и английского языков от компании Яндекс. Яndex.ServerЯndex.Publisher и Яndex.SDK.
Convera Retrierval WareConvera TechnologiesМощная поисковая система, обеспечивающая поиск и анализ информации в больших массивах текстовых данных с использованием запросов на естественном языке. Поддерживает все основные европейские и русский языки.
Поисковая система ИщейкаiSleuthHound Technologies, © 1999-2003Система, позволяющая организовать полнотекстовый поиск на Вашем персональном компьютере. Обрабатывает документы в формате обычного текста, MS Word и HTML. Ищейка использует мощный язык запросов и позволяет находить слова во всех формах и падежах. Рабочие языки - русский и английский. Для загрузки доступна freeware версия с некоторыми ограничениями.
Verity UltraseekVerity Inc.Мощный поисковый движок для полнотекстового поиска. Поддерживает использование морфологии для практически всех европейских языков.
Quintura Search© Quintura Inc., 2005-2006Персональная система полнотекстового поиска в сети Интернет. Поддерживает русский язык, производит кластернизацию результатов поиска и их визуализацию в виде семантической сети.
Яндекс desktopЯндекс, 2005-2006Персональная система полнотекстового поиска Яндекс на локальном компьютере.
Nigma.ruМГУ им.М.В.Ломоносова, факультеты ВМиК и психологии, 2006Интеллектуальная поисковая система Nigma, позволяющая производить поиск по более чем миллиарду русскоязычных документов в глобальном Интернете. Особенностью системы является способность кластеризации полученных результатов по рубрикам. Это значительно облегчает и ускоряет поиск нужной информации.
Локальная поисковая системаSolarix Intellectronix, 2005Программы, предназначенные для организации локальной поисковой системы с поддержкой морфологии и синтаксиса русского, английского, французского, испанского языков.
Интеллектуальный партнер руководителя Интеллектуальный партнер, МинскПрограмма "Интеллектуальный партнер руководителя" (прежнее название "Рабочий стол аналитика") предназначена для полнотекстового семантического анализа документов на русском языке и извлечения из них знаний (прецедентов, примеров, фактов, решений и прогнозов), интересующих пользователя. При поиске используется семантическая сеть понятий, которая может редактироваться пользователем. Наиболее точные и неожиданные в своей божественной мудрости результаты получаются при поиске по деловой и экономической информации. На сайте представлены другие интересные программы и теоретические работы авторов в области семанического анализа данных.

SearchInform
Компания "СОФТИНФОРМ"SearchInform Server
Поисковый сервер, позволяющий организовать полнотекстовый поиск информации в пределах корпоративной сети.
SearchInform Desktop
Инструмент для поиска информации на Вашем компьютере. Поддержка огромного количества форматов файлов и индексация сообщений почтовых клиентов и клиентов для мгновенного обмена сообщениями.
OEM - SearchInform SDK/API
Полнофункциональный инструмент для решения проблемы поиска для сторонних разработчиков. API легко интегрируется в любые приложения и позволяет организовать поиск по любым источникам данных.

Системы синтеза и распознавания речи

НазваниеАвтор(ы), ОрганизацияКомментарий
Sakrament Text-to-Speech Engine v2.0 © компания "Сакрамент", 2002Система синтеза русской речи, созданная минской компанией "Сакрамент". Система польностью соответствует стандарту Microsoft Speech API (SAPI) 5.1. Позволяет произносить тексты мужским и женским голосом, делая при этом интонационные паузы, изменяя по желанию пользователя тон и тембр речи.
CSLU Toolkit© Center for Spoken Language Understanding, 1992-2002Набор инструментальных средств для создания приложений, обрабатывающих речевую и звуковую информацию. Синтез и распознавание речи, озвучивание текстов, обработка спектрограмм и звуковых сигналов. Включает графические компоненты и IDE. Свободный доступ для использования в исследовательских целях.
Платформа: Windows 9x/NT/2000/Me/XP.
CMU Artificial Intelligence Repository © Carnegie Mellon University, School of Computer ScienceСвободно доступный репозитарий программ и ресурсов, посвященный распознаванию и синтезу речи, машинному переводу, морфологическому анализу и другим лингвистическим задачам.
Речевые программы на Websound.ru© Александр Радзишевский, 1995-2003 Страничка с описанием речевых программ для чтения текстов на русском и других языках. Возможность скачивания.
Speech technology Центр Речевых Технологий, С-ПетербургПрограммное обеспечение и инструментальные средства, связанные с анализом и распознаванием речи и обработкой звука.
Fonix SpeechFonixСайт компании Fonix, занимающейся разработкой систем распознавания речи и речевых технологий.
Text-To-Speech Converter for MS WordExitonБесплатная программа, позволяющая озвучить текст, загруженный в окне MS Winword. Требует предустановки в системе речевой компоненты SAPI 5 (4), движка "текст-речь" и .Net Framework 2.0
Govorilka© Anton Ryazanov, 1999-2006Небольшая программа чтения текста голосом для Windows. Настраивается на различные языки и голоса. Использует редактируемые словари произношений. Позволяет записать синтезированную речь в MP3-файл. Требует предустановки в системе речевого движка и компоненты SAPI.
BookMania© Sergey Shishmintzev, Kiev 2005-2006Простая программа, которая конвертирует обычный текст в MP3-файл. Качество синтезированной речи вполне приемлемое.