?

Log in

No account? Create an account
Lazy Frog
22 October 2012 @ 01:53 pm
Привет!

Мы написали пост на Хабрахабр про Открытый корпус.

http://habrahabr.ru/post/152799/

 
 
Lazy Frog
Оригинал взят у nataxane в Место онтологий в современной инженерии на примере ISO 15926
Уважаемые коллеги,

В ближайшую субботу, 29 сентября, состоится очередной семинар по обработке естественного языка. С докладом на тему "Место онтологий в современной инженерии на примере ISO 15926" выступит Андрей Байда.

Сложность задач, стоящих перед современными инженерами, определяется множеством факторов. Это и размер разрабатываемых систем, и необходимость учитывать весь их жизненный цикл. Задача осложняется нетривиальностью взаимодействия между организациями, вовлеченными в создание сложных систем, а также необходимостью соблюдать сроки и бюджеты. При этом современная инженерия немыслима без компьютеров. Как следствие, на этапах от замысла до воплощения и эксплуатации используется большое количество разнообразного ПО, которое обрабатывает данные об одном и том же объекте, но хранит их в несовместимых форматах, что не позволяет передавать их от одной информационной системы к другой без вовлечения человека, искажений, потерь, ошибок. Это представляет собой серьезную проблему, решение которой предложил онтологический стандарт ISO 15926. Для этого потребовалось изменить парадигму, закладываемую в основу моделирования мира, обратиться к переднему краю развития современной логики. В получении практических результатов могут сыграть большую роль достижения современной лингвистики. Данный доклад является введением в решение проблем современной инженерии посредством использования стандарта ISO 15926.

Семинар пройдет 29.09.2012 в 17.00 по адресу: 10 линия В.О. дом 49, ауд 308.
Пароль для прохода через вахту: "Я на семинар".

 
 
Lazy Frog
24 September 2012 @ 01:18 pm
Оригинал взят у lvova в хорошие новости

1. Новость о том, что Адвите удалось занять в голосовании место, достаточное для спасения 3-4 жизней, распространяется чуть медленнее, чем просьбы проголосовать за них. Считаю это досадным и достойным исправления :)

2. Я раньше писала уже об Открытом корпусе русского языка, но не писала, кажется, что на него можно тратить по несколько минут в день, всячески этим помогая науке. Языковые корпусы могут обрабатываться автоматически, но компьютерам необходимо помочь понять некоторые вещи - например, встречается слово "три" в предложении как глагол или как числительное, или "компании" - множественное число или единственное. Человеку это понять легко, выбор делается нажатием одной кнопки, зарегистрироваться можно с помощью социальных сетей или же отдельно на этом сайте, а в итоге получается полезная база данных, доказывающая, к тому же, в очередной раз, что волонтёры могут добиться серьёзных результатов.

Конечно же, программистов они тоже ищут - например, чтобы сделать некие совместные штуки с Викисловарём; а сам корпус построен во многом на Викиновостях и Википедии. Дорогие википедисты, не проходите мимо такого явления, оно вам близко.

 
 
Lazy Frog

Друзья,

1. спасибо всем, кто откликнулся на призыв разрешить использовать тексты ваших журналов в августе 2011 ( http://lazy-frog.livejournal.com/151835.html )!

2. теперь мы начали работу по ручной морфологической разметке текстов, и я прошу вас помочь нам в этом.

Под катом текст про Открытый Корпус и про то, какая именно помощь нам сейчас нужна.


Read more...Collapse )

 
 
Lazy Frog
Оригинал взят у lvova в Википедия любит Петербург: фотоконкурс

НП «Викимедиа РУ» совместно с общественным движением за сохранение культурного наследия Санкт-Петербурга «Живой город», соревнованиями по городскому ориентированию «Бегущий Город» и образовательным вики-проектом в жанре путеводителя для школьников, студентов и учителей Letopisi.ru проводит фотосоревнование Википедия любит Петербург.

Википедия любит Петербург — часть организуемого региональными отделениями Викимедиа международного фотосоревнования Wiki Loves Monuments 2011, проходящего в Европе в сентябре 2011 года. Его предшественником является соревнование Wiki Loves Monuments 2010, прошедшее в Нидерландах в 2010 году, в рамках которого было сфотографировано около 50 000 архитектурных объектов (монументов), и которое, в свою очередь, последовало за соревнованием Wiki Loves Art Netherlands 2009 года, в ходе которого в 45 музеях страны был открыт доступ к фотографированию коллекций для Википедии.

Конкурс Wiki Loves Monuments 2011 состоит из двух частей — региональной и общеевропейской. В конкурсе участвуют самостоятельно сделанные и самостоятельно загруженные под свободной лицензией на Викисклад в сентябре 2011 года фотографии. В российской части конкурса участвуют снимки, на которых запечатлёны памятники архитектуры Санкт-Петербурга; для выхода в общеевропейский тур необходимо войти в число десяти победителей от страны. Кроме того, в конкурсе существует общая видеономинация.

Конкурс призван дать иллюстративный материал для энциклопедического проекта Википедия, а также привлечь внимание к вопросу сохранности памятников архитектурного наследия Санкт-Петербурга.

---
Для участия
* Зарегистрируйтесь на Викискладе
* Выберите памятник
* Загрузите фотографию на Викисклад
и выиграйте!
---
Исходно текст был опубликован здесь под свободной лицензией CC-BY-SA 3.0.

 
 
 
Lazy Frog
Друзья, пришло время рассказать, чем я занимаюсь. И попросить о содействии в этом деле.

Если коротко, то я занимаюсь проектом по созданию лингвистического корпуса, и нам нужны тексты под свободной лицензией, чтобы их в корпус включить. В частности, нужны тексты личных блогов. Корпус будет состоять не только из блогов. В данный момент там уже есть некоторое количество новостных текстов и текстов из Википедии. Если кто-то из вас согласен лицензировать свой личный ЖЖ (твиттер, статусы во вконтакте, ...) по лицензии CC-BY или CC-BY-SA, то это нам очень поможет. Если вы сами не хотите или не можете разрешить использование ваших текстов, но считаете нашу деятельность полезной и хотите нам помочь, то сделайте перепост или поставьте ссылку на этот текст у себя в журнале.

Дальше - обо всём по порядку и очень много букв.

Первая часть поста - о лингвистических корпусах и о нашем проекте.

Вторая - о том, как сделать, чтобы мы могли добавить ваши тексты в корпус (если вы не возражаете, конечно).

За перепост этого обращения я также буду очень благодарен, т.к. нам нужно много текстов.

О лингвистических корпусах и о проекте Открытый корпус ...Collapse )

Если вы согласны нам помочь, то мы просим вас разрешить использование ваших текстов на условиях лицензий Creative Commons - Attribution или Creative Commons - Attribution - Share Alike. Это довольно широкие лицензии: обе позволяют дальнейшее использование материалов неограниченным кругом лиц, в том числе и в коммерческих целях. Последнее важно для нас (т.е. ограничение NonCommercial нам не подходит), т.к. мы хотим, чтобы корпус могли использовать не только студенты и аспиранты, но также и небольшие компании и стартапы. Мы надеемся, что с его помощью они смогут создать новые продукты, которые принесут пользу всем нам. Если тексты в вашем ЖЖ имеют коммерческую ценность, или вы планируете как-то зарабатывать на них деньги, то, возможно, вам не надо нам помогать (по крайней мере этим способом :) ), т.к. это (разрешение использовать ваши тексты в коммерческих целях) может повредить вашим интересам. Если ваши тексты - это ваш личный дневник, и использование их кем-то ещё (с указанием вашего авторства) или их переработка не может вам повредить, то, возможно, вам стоит нам помочь. Если хотите. ;)

Подробности ...Collapse )

Спасибо!
Бочаров Виктор
участник проекта Открытый корпус
OpenCorpora.org

 
 
Lazy Frog
10 May 2010 @ 11:40 pm
Рейтинг онлайн-СМИ на основе дублирования новостей

дата: 15 мая, суббота, 17-00
докладчик: Александр Антонов (Галактика Зум, Москва)


- Рейтинг онлайн-СМИ в ситуации большого выбора источников может быть средством как явного вспомогательного инструмента - информации, предоставляемой для пользователя, так и неявного (применения полученных данных для ранжирования новостных сообщений при показе новостей).

- Обзор существующих подходов к составлению публикуемых рейтингов новостных источников. Примеры: Newsknife.com, Webscan, Медиалогия, Hitwise.com, Comscore.com, Nielsen.com, Reddit.com, Digg.com.

- Алгоритм формирования рейтинга новостных источников для ресурса webground.su. Ранжирование источников основано на информации о группах найденных новостей-дубликатов и признаком времени публикации, приписанном новостям.

Каждое из выделенных подмножеств представляется в виде направленного графа, вершинами которого являются сообщения, а ребрами - отношения в упорядочении внутри подмножества. К построенным графам применен алгоритм PageRank, с помощью которого каждой из вершин-сообщений на графе присваивается соответствующий вес.

Адрес прежний: 10-я линия В.О., д.49, ауд. 308
Вход на семинар свободный, предварительной регистрации не требуется.

http://mathlingvo.ru/nlpseminar/archive/s_34
 
 
Lazy Frog
02 April 2009 @ 05:49 pm
Во время производства перепутаны препараты:

Милдронат (http://www.webapteka.ru/drugbase/name4074.html) – препарат для лечения нарушений обмена веществ (фактически - «витамин»), может применяться в домашних условиях, свободно продается в аптеках.

Листенон – препарат для анестезии, может вводиться только в операционных и отделениях интенсивной терапии при наличии обученного персонала. При введении в течение 30 секунд вызывает полную остановку самостоятельного дыхания. Если больного при этом не подключить к аппарату искусственной вентиляции легких, он погибает.
Ссылка на описание препарата Листенон http://medi.ru/doc/a7969.htm

Этот текст + подробности и ссылка на документ: http://dok-zlo.livejournal.com/371571.html
 
 
Lazy Frog
29 December 2008 @ 01:48 am
http://drinkin-angel.livejournal.com/38274.html
Тётечка ищет пропавшего в СПб мужа. Помогите ей, пожалуйста.