Онлайн поддержка
Все операторы заняты. Пожалуйста, оставьте свои контакты и ваш вопрос, мы с вами свяжемся!
ВАШЕ ИМЯ
ВАШ EMAIL
СООБЩЕНИЕ
* Пожалуйста, указывайте в сообщении номер вашего заказа (если есть)

Войти в мой кабинет
Регистрация
ГОТОВЫЕ РАБОТЫ / ДОКЛАД, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Методики обнаружения нового знания в хранилищах данных (KDD)

Workhard 130 руб. КУПИТЬ ЭТУ РАБОТУ
Страниц: 14 Заказ написания работы может стоить дешевле
Оригинальность: неизвестно После покупки вы можете повысить уникальность этой работы до 80-100% с помощью сервиса
Размещено: 29.09.2021
Введение. Обнаружение знаний в базах данных (KDD) - это автоматический исследовательский анализ и моделирование больших репозиториев данных. KDD - это организованный процесс выявления достоверных, новых, полезных и понятных шаблонов из больших и сложных наборов данных. Data Mining (DM) - это ядро процесса KDD, включающее в себя вывод алгоритмов, которые исследуют данные, разрабатывают модель и обнаруживают ранее неизвестные закономерности. Модель используется для понимания явлений на основе данных, анализа и прогнозирования. Доступность и обилие данных сегодня делают открытие знаний и интеллектуальный анализ данных делом значительной важности и необходимости. Учитывая недавний рост этой области, неудивительно, что теперь исследователям и практикам доступен широкий спектр методов. Ни один метод не превосходит другие во всех случаях. Особенными недавними аспектами доступности данных, которые способствуют быстрому развитию KDD и DM, является электронная готовность данных (хотя и разных типов, и надежности). Быстрое развитие Интернета и интранета, в частности, способствует доступности данных. Методы, которые были разработаны до революции в Интернете, учитывали меньшие объемы данных с меньшей изменчивостью типов данных и надежности. С наступлением информационной эпохи сбор данных стал проще, а их хранение - недорогим. Было подсчитано, что объем хранимой информации удваивается каждые двадцать месяцев. К сожалению, по мере увеличения объема информации, хранящейся в электронном виде, способность понимать и использовать ее отстает от ее роста. Data Mining - это термин, созданный для описания процесса поиска в больших базах данных интересных шаблонов и взаимосвязей. Сегодняшние исследования направлены на моделирование и анализ на основе фактов, как и ведущая практика в медицине, финансах и многих других областях. Доступность данных растет в геометрической прогрессии, в то время как уровень обработки человеком практически не меняется. Таким образом, разрыв увеличивается экспоненциально. Этот пробел дает возможность для области KDD / DM, которая, следовательно, становится все более важной и необходимой.
Введение

Введение. Обнаружение знаний в базах данных (KDD) - это автоматический исследовательский анализ и моделирование больших репозиториев данных. KDD - это организованный процесс выявления достоверных, новых, полезных и понятных шаблонов из больших и сложных наборов данных. Data Mining (DM) - это ядро процесса KDD, включающее в себя вывод алгоритмов, которые исследуют данные, разрабатывают модель и обнаруживают ранее неизвестные закономерности. Модель используется для понимания явлений на основе данных, анализа и прогнозирования. Доступность и обилие данных сегодня делают открытие знаний и интеллектуальный анализ данных делом значительной важности и необходимости. Учитывая недавний рост этой области, неудивительно, что теперь исследователям и практикам доступен широкий спектр методов. Ни один метод не превосходит другие во всех случаях. Особенными недавними аспектами доступности данных, которые способствуют быстрому развитию KDD и DM, является электронная готовность данных (хотя и разных типов, и надежности). Быстрое развитие Интернета и интранета, в частности, способствует доступности данных. Методы, которые были разработаны до революции в Интернете, учитывали меньшие объемы данных с меньшей изменчивостью типов данных и надежности. С наступлением информационной эпохи сбор данных стал проще, а их хранение - недорогим. Было подсчитано, что объем хранимой информации удваивается каждые двадцать месяцев. К сожалению, по мере увеличения объема информации, хранящейся в электронном виде, способность понимать и использовать ее отстает от ее роста. Data Mining - это термин, созданный для описания процесса поиска в больших базах данных интересных шаблонов и взаимосвязей. Сегодняшние исследования направлены на моделирование и анализ на основе фактов, как и ведущая практика в медицине, финансах и многих других областях. Доступность данных растет в геометрической прогрессии, в то время как уровень обработки человеком практически не меняется. Таким образом, разрыв увеличивается экспоненциально. Этот пробел дает возможность для области KDD / DM, которая, следовательно, становится все более важной и необходимой.
Содержание

Содержание Введение. 3 1. Основоположники концепции KDD. 4 2. Как появился термин KDD? 5 3. Процесс KDD. 6 4. Data Mining (интеллектуальный анализ данных) – как один из этапов KDD. 10 4.1. Методы Data Mining. 10 4.2. Компоненты Data Mining | Алгоритмы. 11 5. Конференция SIGKDD как одна из составляющих KDD. 12 6. Пример реализации KDD | Data Mining. 13 7. Заключение. 15 Список литературы: 15
Список литературы

Список литературы: 1) Jiawei Han, Micheline Kamber, Pei Jian - Data Mining. Concepts and Techniques (2012). 2) Биография из Википедии. 3) Официальный сайт ассоциации SIGKDD https://www.kdd.org/ 4) Интервью с Григорием И. Пятецкий-Шапиро с сайта - http://datareview.info/ 5) Технология очистки и трансформирования данных в рамках Knowledge Discovery in Databases (KDD) для ускоренного применения методов Data Mining - Ю.А. Шичкина, А.Б. Дегтярев, А. А. Коблов. 6) Анализ данных и процессов: учеб. пособие / А. А. Барсегян, М. С. Куприянов, И. И. Холод, М. Д. Тесс, С. И. Елизаров. 7) Usama Fayyad, Gregory Piatetsky - Shapiro, Padhraic Smyth - An overview of tile steps comprising tile KDD process (1996).
Отрывок из работы

1. Основоположники концепции KDD. Компьютеризация нашего общества существенно расширила наши возможности как для генерации, так и для сбора данных из различных источников. Огромное количество данных заполнило почти все аспекты нашей жизни. Этот взрывной рост хранимых или временных данных вызвал острую потребность в новых методах и автоматизированных инструментах, которые могут разумно помочь нам преобразовать огромные объемы данных в полезную информацию и знания. Это привело к появлению многообещающего и процветающего рубежа в компьютерных науках, называемого интеллектуальным анализом данных, и его различных приложений. Интеллектуальный анализ данных(Data Mining), также широко известный как обнаружение знаний из данных (KDD), представляет собой автоматическое или удобное извлечение шаблонов, представляющих знания, неявно сохраненные или захваченные в больших базах данных, хранилищах данных, Интернете, других крупных информационных репозиториях или потоках данных. Основоположниками концепции KDD считаются Григорий И. Пятецкий-Шапиро и Усама М.Файад. Григорий И. Пятецкий-Шапиро (Gregory I. Piatetsky-Shapiro) -специалист по данным и соучредитель конференций KDD, а также соучредитель и бывший председатель группы SIGKDD - Ассоциации вычислительной техники по обнаружению знаний, интеллектуальному анализу данных и науке о данных, также является президентом KDnuggets. Кстати, Григорий является сыном Ильи Пятецкого-Шапиро, который был одним из ведущих математиков в Москве. Усама М.Файад (Usama M. Fayyad) - американский специалист по данным и соучредитель конференций KDD и ассоциации ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. Он является спикером по бизнес – аналитике, интеллектуальному анализу данных, научных данных и больших данных. Существует ещё такое понятие как Data Mining – интеллектуальной анализ данных, отличие его от KDD в том, что KDD относится к общему процессу обнаружения полезных знаний из данных, тогда как интеллектуальный анализ данных относится к конкретному этапу этого процесса – как писал Григорий Пятецкий в одной из своих книг. 2. Как появился термин KDD? KDD (Knowledge Discovery in Databases) берёт своё начало во второй половине 20 века и описывает определённую последовательность действий, которой необходимо следовать для извлечения полезного знания. Данная концепция Григория Пятецкого появилось благодаря его отцу Ильи Пятецкого-Шапиро (советский, израильский и американский математик, специалист в аналитической теории чисел, теории представлений групп и алгебраической геометрии. Лауреат премии Вольфа и Премии Израиля), он привил ему любовь к числам. Всё это привело его к изучению компьютерных наук и заинтересованности в искусственном интеллекте и машинном обучении. В Нью-Йорском университете Григорий защитил докторскую диссертацию по использованию метода машинного обучения для оптимизации баз данных и его первая работа также была связана с БД. В итоге он решил объединить две интересующие его области (машинное обучение и БД) в нечто общее – так и родилась концепция KDD (обнаружение знаний в базах данных). И немного статических данных из интервью с основоположником Григорием Пятецким-Шапиро: Статистики в 1960х годах стали использовать такие термины как Data fishing (Data dredging), критикуя практику анализа данных. Data Mining стал применяться в 1990х годах в базах данных, а после Григорий ввёл термин KDD, обрёкший популярность в академических или исследовательских кругах. А позже Data Mining прижилось в бизнес-среде и прессе, хотя в 2003 году и заработало себе дурную славу. Именно его ассоциировали с американской государственной программой TIA (Total information Awareness – полная информационная прозрачность), которая была закрыта в результате протестов правозащитников. В 2006 году большую популярность приобрело понятие Analytics. Во многом это было связано с появлением сервиса Google Analytics в декабре 2005-го. Согласно показателям Google Trends, термин Analytics в 2006 году обошел по популярности понятие Data Mining, хотя затем его рейтинги начали падать. Термин Data Science родился в начале 2000-х годов, но в своем современном значении начал использоваться только в 2012-м.
Условия покупки ?
Не смогли найти подходящую работу?
Вы можете заказать учебную работу от 100 рублей у наших авторов.
Оформите заказ и авторы начнут откликаться уже через 5 мин!
Похожие работы
Доклад, Информационные технологии, 13 страниц
300 руб.
Доклад, Информационные технологии, 15 страниц
200 руб.
Доклад, Информационные технологии, 14 страниц
120 руб.
Доклад, Информационные технологии, 7 страниц
100 руб.
Доклад, Информационные технологии, 7 страниц
150 руб.
Доклад, Информационные технологии, 15 страниц
250 руб.
Служба поддержки сервиса
+7 (499) 346-70-XX
Принимаем к оплате
Способы оплаты
© «Препод24»

Все права защищены

Разработка движка сайта

/slider/1.jpg /slider/2.jpg /slider/3.jpg /slider/4.jpg /slider/5.jpg