анализ данных

О разработке гибридных нейросетевых моделей в задачах прогнозирования временных рядов

О разработке гибридных нейросетевых моделей в задачах прогнозирования временных рядов

Автор статьи: Е.В. Пучков Последнее время нейронные сети продемонстрировали впечатляющие результаты при решении прикладных задач анализа данных. Как и любой метод, искусственные нейронные сети имеют свои достоинства и недостатки. К главному достоинству нейронных сетей относится их способность эффективно строить нелинейные зависимости, точно описывающие исходные данные. Другими достоинствами являют... Читать полностью...

Разработка инжинирингового подхода к моделированию ценообразования на рынке строительных материалов

Разработка инжинирингового подхода к моделированию ценообразования на рынке строительных материалов

Авторы статьи: Е.В. Пучков 30 сентября 2017 года запущена в опытную эксплуатацию государственная информационная система ценообразования в строительстве. Эти работы проводятся в рамках реформы системы ценообразования Министерством строительства и жилищно-коммунального хозяйства Российской Федерации.  Материальные ресурсы являются одним из основных элементов сметной стоимости строительства. Номенкла... Читать полностью...

RStudio - среда разработки для R

RStudio - среда разработки для R

RStudio это интегрированная среда разработки для R – языка программирования для статистической обработки данных и построения различных видов визуализации данных. RStudio сочетает интуитивный пользовательский интерфейс с мощной консолью R, позволяя таким образом выжать из инструмента максимум возможностей. RStudio бесплатен, предназначен для пользователей Mac, Windows и Linux, позволяет использоват... Читать полностью...

Orange - инструмент для визуализации и анализа данных

Orange - инструмент для визуализации и анализа данных

Orange является инструментом для визуализации и анализа данных с открытым исходным кодом. Интеллектуальный анализ данных проводится путем визуального программирования и с помощью Python сценариев. Основные характеристики: Сохраняет выбор пользователя; Интеллектуально выбирает каналы связи между виджетами; Присутствует множество вариантов визуализации от гистограмм до тепловых карт; Набор с более ч... Читать полностью...

Pandas - библиотека для анализа данных в Python

Pandas - библиотека для анализа данных в Python

Pandas - это библиотека с открытым исходным кодом, обеспечивающая высокую производительность, легка в использовании структуры и инструментов анализа данных для языка программирования Python. Библиотека может считыватть данныезаписи в формате CSV , Excel, HDF, SQL, JSON, HTML и форматы Stata. Pandas хорошо подходит для работы с различными типами данных: Табличные данные со столбцами различных типов... Читать полностью...

Scikit-learn - машинное обучение на Python

Scikit-learn - машинное обучение на Python

Scikit-learn это библиотека для машинного обучения на языке программирования Python  с открытым исходным кодом. С помощью нее можно реализовать различные алгоритмы классификации, регрессии и кластеризации, в том числе алгоритмы SVM, случайного леса, k-ближайших соседей и DBSCAN, которые построены на взаимодействии библиотек NumPy и SciPy с Python. Достоинствами данной библиотеки являются: Простые ... Читать полностью...

Задачи в области маркетинга

Задачи в области маркетинга

  Принятие решений о выводе нового товара на рынок, оптимизация затрат на рекламу, оценка потребительских предпочтений, сегментация клиентов и другие маркетинговые задачи сегодня решаются на основе тщательного анализа данных компании и рынка. Существуют большое количество методов для решений маркетинговых задач. Некоторые из них представлены в таблице.   №п/п Название метода Суть метода ... Читать полностью...

20 популярных открытых проектов для машинного обучения

20 популярных открытых проектов для машинного обучения

Самыми популярными библиотеками для машинного обучения по количеству участников и активности изменений оказались scikit-Learn, PyLearn2 and NuPic. Python-проекты по машинного обучению на GitHub. Цветом отмечено отношение количества изменений  к количеству участников в проекте. Bob, IEPY, Nilearn и NuPIC имеют наивысшее значение. По данным KDnuggets Читать полностью...