Обсуждение участника:IbragimovaN
Добавить темуДобро пожаловать в Викиверситет!
[править]Здравствуйте, и добро пожаловать в русскоязычную часть Викиверситета! Надеемся, Вы получите большое удовольствие от участия в проекте.
Постарайтесь вначале статьи обозначить цель Вашей работы. Укажите, является ли создаваемая Вами страница учебным курсом или исследовательской работой.
Если Вы хотите написать энциклопедическую статью, то для этого есть Википедия, см. Чем не является Викиверситет.
Ознакомьтесь, пожалуйста, с вики-разметкой и принципами размещения и именования статей.
Чтобы получать актуальную информацию о событиях, происходящих в Викиверситете, Вы можете установить шаблон {{Актуально}}, например, в самое начало своей страницы обсуждения.
Иллюстрации загружайте на Викисклад, предназначенный для хранения медиафайлов вики-проектов. Прочитайте, пожалуйста, брошюру об основах иллюстрирования статей в Википедии и работе на Викискладе. Загруженные файлы на Викисклад можно будет одинаково легко использовать в Википедии и в Викиверситете.
По всем вопросам смело обращайтесь на портал сообщества или к одному из администраторов.
При этом, пожалуйста, подписывайтесь на страницах обсуждения (но не в статьях Викиверситета), используя четыре идущих подряд знака тильды (~~~~). И ещё раз — добро пожаловать! :-) вы можете убрать данный шаблон с вашей страницы обсуждения по собственному желанию
- Изучаемая дисциплина - Информационные технологии в лингвистике
Занятие 18.09.2010 (№ 2)
[править]Википедия (англ. Wikipedia) — это свободная общедоступная многоязычная универсальная интернет-энциклопедия, поддерживаемая некоммерческой организацией «Фонд Викимедиа». Название образовано от слов «вики» (технологии для создания сайтов) и «энциклопедия». Более 16 миллионов статей Википедии написаны совместно добровольцами со всего мира, и почти все эти статьи могут быть изменены любым посетителем сайта. Участников Википедии называют википедистами.Запущенная в январе 2001 года Джимми Уэйлсом и Ларри Сэнгером, Википедия сейчас является самым крупным и наиболее популярным справочником в Интернете.
Структура статьи Википедии общего характера представляет собой загловок по теме, и такие подразделы, как: история развития, ученые слависты, примечания,см. также,ссылки,ресурсы,центры изучения славистики, журналы.Филологическая информация находится в родственных проектах фонда Викимеди: проект Викитека, проект Викисловарь, проект Викицитатник и проект Викиверситет. Проект Викитека представляет собой свободную сетевую библиотеку на русском языке, что несет немалую филологическую значимость для лингвистов. В проекте Викицитатник имеются цитаты известных людей, что также представляет собой огромную находку для филологов.
IbragimovaN 05:40, 18 сентября 2010 (UTC) IbragimovaN 05:16, 18 сентября 2010 (UTC)
Хорошо.Но не увлекайтесь копированием. Лучше меньше - но своё --NSA52 05:18, 18 сентября 2010 (UTC)
За консультациями обращайтесь ко мне но мою страницу обсуждения Обсуждение_участника:NSA52
Занятие (25.09.2010) (№3)
[править]Осенью 2009 года в Рунете нашлось порядка 15 миллионов сайтов (6,5% от сайтов всей сети).
Это 6,5% от тех 230,4 млн. сайтов, что, по октябрьским данным Netcraft, составляют всемирную сеть. При этом 37,5 миллионов пользователей в России (данные ФОМ) – это 2,2% от всей аудитории интернета (1,7 млрд., данные Internet World Stats). Таким образом, на одного пользователя в Рунете приходится больше сайтов, чем в среднем в мире.
Информационные консалтингвоые компании обладают наивысшей достоверностью.
Скрытый или невидимый web - это чаще всего динамически формируемые web-страницы, содержание которых храниться в БД и доступно лишь по запросам пользователей. www.lexisnexis.com предоставляет своим пользваетлям юридическую, новостную, политическую, коммерческую и др. информацию. Имеет 35 000 источников информации, содержащей 4,6 млрд. документов с глубиной до 200 лет.
IbragimovaN
Навыки потеряли! Информацию надо сохранять здесь--NSA52 06:01, 25 сентября 2010 (UTC)
Занятие (2.10.2010) (№4)
[править]Виды поиска, Что такое поисковый индекс? Какую поисковую систему по данным компании Net Applications в апреле 2010 года использовали 3,45 % пользователей. Перечислите отечественные поисковые системы. Приведите примеры локальные поисковых утилит. Какие функции выполняет программа ЛВС searcher_word? Какие функции выполняет программа ЛВС searcher_synonym? Какие функции выполняет программа ЛВС searcher_index? Для чего используются знаки "+" и "-" в языке запросов? В каком виде может быть представлен текст? Какая информация называется первичной? Что называется полем знаний? Что отражает функциональная структура предметной области? В каких целях могут использоваться автоматизированные системы обработки информации? Какая система может использоваться в качестве инструмента для формирования электронных архивов? Что такое графематический анализ?
Поиск бывает следующих видов: 1.Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы. 2.Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows). 3.Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polar Rose, Picollator и др.
Поисковый индекс - процесс сбора, сортировки и сохранения данных с целью облегчить быстрый и точный поиск информации. Дизайн индекса включает междисциплинарные понятия из лингвистики, когнитивной психологии, математики, информатики и физики. Альтернативное название для этого процесса в контексте поисковых машин, разработанных, чтобы искать веб-страницы в Интернете, является индексацией Сети.
По данным компании Net Applications в апреле 2010 года использовали Baidu 3,45 % пользователей.
Отечественные поисковые сисетемы: Yandex, Rambler, Aport, Nigma, Mail.
Поисковые утилиты:
A.I. Friend Lite 1.0 — поиск в интернете и калькулятор
Разработчик: http://schulers.com/software
Лицензия: Бесплатная
ОС: windows
A.I. Friend — это простой в использовании инструмент для решения математических задач и поиска ответов на почти любые вопросы. Искусственный интеллект поможет вам в ваших исследованиях! Родным языком A.I. Friend является английский. С данной программой ваш поиск в интернете станет продуктивным и ускорится в несколько раз. A.I. Friend — это калькулятор и полезная утилита для поиска. В процессе работы приложение отображает несколько рекламных баннеров.
Поисковая утилита AVSearch - "Программа предназначена для поиска файлов по фрагментам текста в любой русской кодировке. Возможен поиск в архивах, в КЭШах Web-браузеров, на сетевых дисках, в "Корзине" и т.д." - так представляет свою программу сам автор.
А также поисковые утилиты Xteq X-Find, Agent Ransack, EF Find.
Так наверное информация лучше будет смотреться--NSA52 05:48, 2 октября 2010 (UTC)
Функции,которые выполняет программа ЛВС searcher_word: поиск слов во всех его возможные модификациях. Программа ЛВС searcher_synonym позволяет найти синоним к желаемому слову.
Нурия! Следи за оформлением. Делай пропуски между абзацами. --NSA52 05:38, 9 октября 2010 (UTC)
Занятие№5
[править]- Что помимо текста может выступать в качестве объект статистического исследования?
- Что утрачивается и какие возможности появляются при работе с текстом в компьютерной среде?
- Что может быть проинтерпретировано как двухступенчатый отбор при статистической обработке текста?
- Что такое Иску́сственный интелле́кт?
- Что проводится в рамках направления "Обработка естественного языка".
- Главные задачи направления "Обработка естественного языка".
- Что такое Инженерия знаний?
- Что понимается под термином "Машинное творчество".
- Кто и когда ввел термин гибридный интеллект?
- Что такое Экспертная система?
- Чем объясняется потребность в специалистах, хорошо знающих основы и методы современной компьютерной статистики?
- Что такое Онтология?
Помимо текста в качестве объект исследования может выступать и совокупность (или корпус) произведений одного автора при условии их принадлежности к одному жанру.
В компьютерной среде в значительной мере утрачивается комплексность традиционной филологии, и в то же время обретаются возможности для единообразной и быстрой обработки печатного текста. Искусственный интеллект - это наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Он связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами.
В рамках направления «Обработка естественного языка» проводится анализ возможностей понимания, обработки и генерации текстов на «человеческом» языке. В частности, здесь ещё не решена проблема машинного перевода текстов с одного языка на другой. В современном мире большую роль играет разработка методов информационного поиска. По своей природе, оригинальный тест Тьюринга связан с этим направлением.
Главные задачи направления "Обработка естественного языка": Синтез речи, Распознавание речи, Анализ текста,Синтез текста,Машинный перевод,Вопросно-ответные системы, Информационный поиск,Извлечение информации,Упрощение текста,Технология перевода,Робот(программа),Автореферат.
Инженерия знаний — область искусственного интеллекта, связанная с разработкой экспертных систем и баз знаний. Изучает методы и средства извлечения, представления, структурирования и использования знаний.
Машинное творчество относится к машинному (автоматическому) созданию произведений искусств и может быть разных видов: 1.Сочинение музыкальных мелодий машинами (англ.) 2.Электронная музыка (упрощённый вид) — генерация звуков или однотипных мелодий — решается с помощью специальных программ-трекеров, синтезаторов, секвенсоров,драм-машин, схемы AY-3-8910. 3.Автоматическая генерация текстов (англ.) 4.Автоматическая генерация рисунков.
Советский психолог В.Ф.Венда ввел понятие "гибридный интеллект" в 1975 году, как контр понятие "искусственному интеллекту" и чтобы подчеркнуть непреходящее эволюционное значение взаимодействия естественных интеллектов в природе, обществе и технике. Чуть позже в начале 80-х годов была выдвинута идея гибридного интеллектуального управления [ Гельфандбейн, Колесников, Рудинский, 1983, 1984] на основе многомодельных систем.
Экспертная система — это программа для компьютера, которая оперирует со знаниями в определенной предметной области с целью выработки рекомендаций или решения проблем.[1] Программа может являться экспертной системой при соблюдении следующих условий: -программа должна обладать знаниями; -знания, которыми обладает программа, должны быть сконцентрированы на определенную предметную область; -из этих знаний должно непосредственно вытекать решение проблем.
Потребность в специалистах, хорошо знающих основы и методы современной математической статистики и владеющих навыками их практической реализации на компьютерах объясняется тем, что компьютерная реализация современных статистических методов обработки информации является сегодня одним из наиболее эффективных инструментов принятия рациональных решений в самых разных областях человеческой деятельности.
Онтлогии- это формальные явные описания терминов предметной области и отношений между ними. Во всемирной паутине онтологии стали обычным явлением. Онтология определяет общий словарь для ученых, которым нужно совместно использовать информацию в предметной области. Она включает машинно-интерпретируемые формулировки основных понятий предметной области и отношения между ними.
Занятие № 6
[править]Институт лингвистики - это? РГГУ - это? Какие задачи могут решать специалисты, подготовленные на кафедре прикладной и экспериментальной лингвистики МГЛУ? Цель проекта The LINGUIST List? История проекта The LINGUIST List Что содержит секция Software Tools проекта The LINGUIST List? What is SIL International? Структура научно-образовательного портала "Лингвистика в России: ресурсы для исследователей"? Структура проекта FILOLOGIA.su Блоги и сообщества по лингвистике по теме исследования.
Институт лингвистики – научное и образовательное учреждение в структуре Российского государственного гуманитарного университета. Институт возник в 2000 году на базе Факультета теоретической и прикладной лингвистики. Первый выпуск студентов-лингвистов состоялся в 1995 году. Сейчас Институт лингвистики включает Факультет теоретической и прикладной лингвистики и Отделение интеллектуальных систем в гуманитарной сфере. Факультет теоретической и прикладной лингвистики в свою очередь состоит из трех отделений: Отделения теоретической лингвистики, Отделения «Языки и теория коммуникации» и Отделения иностранных языков. Институт также объединяет шесть кафедр и два учебно-научных центра. Обучение студентов ведется по следующим специальностям: «Теоретическая и прикладная лингвистика» «Теоретическая и прикладная лингвистика» (со специализацией «Языки и теория коммуникации») «Перевод и переводоведение» «Интеллектуальные системы в гуманитарной сфере».
РГГУ- это Росси́йский госуда́рственный гуманита́рный университе́т — крупный учебно-научный центр в Москве, организованный в марте 1991 года на базе Московского государственного историко-архивного института (который был создан 30 сентября 1930 года постановлением ЦИК РСФСР как Институт архивоведения).
Специалисты, подготовленные на кафедре прикладной и экспериментальной лингвистики МГЛУ способны ставить и решать задачи в области автоматического реферирования и аннотирования текстов, разработки искусственных языков, решения лингвистических проблем искусственного интеллекта и машинного перевода, автоматизации лексикографических процессов, создания терминологических словарей и словарных банков данных, моделирования типов межъязыковых отношений, проблем языковой политики, унификации и стандартизации терминологии и разработки терминосистем, автоматического распознавания устной речи, идентификации и верификации личности по устной и письменной речи и др.
LINGUIST List — это крупнейший интернет-ресурс международного лингвистического сообщества. Основан в 1990 году Энтони Аристаром. Сайт поддерживается на английском языке и содержит объявления о конференциях, публикациях, вакансиях для лингвистов, базу данных по персоналиям и организациям и пр. информацию. Электронная рассылка сайта охватывает несколько тысяч подписчиков.
Электронная лингвистическая рассылка LINGUIST List была создана в 1990 году Энтони Аристаром в Университете Западной Австралии и первоначально имела 60 подписчиков. В 1991 году вторым модератором рассылки стала Хэлен Драй; в том же году LINGUIST List переместился в Техасский университет A&M. С 1991 года страница проекта LINGUIST List находилась на сайте Университета Восточного Мичигана. В 1996 году было зарегистрировано доменное имя linguistlist.org и с 1997 года проект стал развиваться на собственном сайте. Работу по поддержанию сайта вели сотрудники Университета Восточного Мичигана и Университета Уэйна, однако в 2006 году при Университете Восточного Мичигана для этой цели был основан специальный центр — Институт лингвистической информации и технологий. Работа над сайтом в разные годы поддерживалась грантами Национального научного фонда США (National Science Foundation), а также частными пожертвованиями.
SIL International является американской всемирной некоммерческая организацией, основной целью которой является исследование, разработка и документирование языков, особенно менее известных, в целях расширения языковых знаний, поощрения грамотности и помощи в развитии языка. SIL предоставляет базу данных, Ethnologue, его исследования в мире языков. SIL имеет более 6000 членов из более чем 50 странах мира.
Структура научно-образовательного портала "Лингвистика в России: ресурсы для исследователей":В настоящее время портал знаний доступен по адресу http://uniserv.iis.nsk.su/cl. Его контент включает более 600 интернет-ресуров, около 2000 информационных объектов, связанных примерно 4000 отношениями. Пользователь может видеть не только иерархию «общее-частное», заданную на понятиях онтологии, но и иерархии «часть-целое», заданные на информационных объектах. Ресурсы для исследователей: Теоретическая и прикладная лингвистика Компьютерная лингвистика Русский язык Языки народов Российской Федерации Языки мира Инновации (гранты, стипендии, стажировки, бизнес) Персоналии (люди, общества, научные коллективы, исследовательские проекты) Публикации Конференции, семинары, форумы Приложения лингвистики (смежные области)
ПРОЕКТ FILOLOGIA.su(структура): портал задуман как удобный путеводитель по безбрежному морю сайтов и материалов, посвященных филологии, лингвистике и комплексу гуманитарных наук. В Интернете сегодня десятки тысяч филологических и лингвистических сайтов и ресурсов. Один тематический портал охватить их все конечно же не в состоянии. Он не заменит поисковые машины и крупные коммерческие каталоги. Хотя, если заглянуть в некоторые достаточно авторитетные каталоги, то окажется, что соответствующие рубрики почти пусты. То ли раскруткой образовательных ресурсов никто не занимается, то ли их в процентном отношении существенно меньше, чем объявлений "куплю-продам" и блогов обо всем и ни о чем.
IbragimovaN