Инструменты

Организация экспериментов анализа данных

Организация экспериментов анализа данных

Sacred - инструмент для настройки, организации, логирования и запуска вычислительных экспериментов. С помощью Sacred Вы сможете: Следить за всеми параметрами эксперимента. Легко запускать эксперимент с различными настройками. Сохранять конфигурации экспериментов в файлы или базу данных. Воспроизводить результаты. Читать полностью...

Azure Machine Learning

Azure Machine Learning

Azure Machine Learning – облачный сервис для выполнения задач прогнозной аналитики. С помощью облака машинное обучение Azure делает машинное обучение доступнее для более широкой аудитории. Машинное обучение Azure предназначено для новичков и опытных специалистов по изучению данных. С машинным обучением Azure не нужно устанавливать программное обеспечение, настраивать оборудование или скрытую среду... Читать полностью...

Amazon Machine Learning

Amazon Machine Learning

Amazon Machine Learning – это сервис, который упрощает использование технологии машинного обучения для разработчиков любого уровня квалификации. Amazon Machine Learning включает инструменты визуализации и специальные мастера, которые помогут вам в создании моделей машинного обучения и избавят вас от необходимости изучать сложные алгоритмы и технологии. По завершении создания моделей Amazon Machine... Читать полностью...

RStudio - среда разработки для R

RStudio - среда разработки для R

RStudio это интегрированная среда разработки для R – языка программирования для статистической обработки данных и построения различных видов визуализации данных. RStudio сочетает интуитивный пользовательский интерфейс с мощной консолью R, позволяя таким образом выжать из инструмента максимум возможностей. RStudio бесплатен, предназначен для пользователей Mac, Windows и Linux, позволяет использоват... Читать полностью...

Shiny - пакет для создания веб-приложений

Shiny - пакет для создания веб-приложений

Shiny - пакет для создания веб-приложений на основе R. Shiny отличается особой простотой, с которой пользователи могут создавать свои приложения (в частности, не требуются знания HTML и/или Java). Важными концепциями, реализованными в пакете Shiny, являются: Входные данные хранятся в объекте input, выходные - в объекте output. Извлечение необходимых данных выполняется обычным для R способом - при ... Читать полностью...

Rattle - графический интерфейс к R

Rattle - графический интерфейс к R

Rattle - это графический пользовательский интерфейс для интеллектуального анализа данных на языке программирования R. Программа предназначена для выявления скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Rattle – это среда для «разглядывания» данных человеком, и программа всячески помогает ему в этом деле. Альтернативное название пакета: «A GNOM... Читать полностью...

D3 — интерактивная визуализация данных

D3 — интерактивная визуализация данных

D3 — это JavaScript-библиотека, с помощью которой можно создавать как статичные, так и интерактивные визуализации сложных данных. Главная задача этой библиотеки — наглядная визуализация больших массивов данных, по которой можно было делать выводы и находить закономерности. Всё, что потребуется для начала работы — это минимальные знания HTML+CSS+JS. Вы просто программируете алгоритм и внешний вид, ... Читать полностью...

Orange - инструмент для визуализации и анализа данных

Orange - инструмент для визуализации и анализа данных

Orange является инструментом для визуализации и анализа данных с открытым исходным кодом. Интеллектуальный анализ данных проводится путем визуального программирования и с помощью Python сценариев. Основные характеристики: Сохраняет выбор пользователя; Интеллектуально выбирает каналы связи между виджетами; Присутствует множество вариантов визуализации от гистограмм до тепловых карт; Набор с более ч... Читать полностью...

BigML - машинное обучение в облаке

BigML - машинное обучение в облаке

BigML – облачный сервис машинного обучения, обладающий широкими возможностями масштабирования. Инструмент, по словам разработчиков, рассчитан на удовлетворение потребностей бизнеса, которые касаются больших данных и облачных вычислений, а также призванный сделать прогнозирование и его результат как можно более простым, понятным и пригодным для демонстрации конечным пользователям. Достоинства BigML... Читать полностью...

Pandas - библиотека для анализа данных в Python

Pandas - библиотека для анализа данных в Python

Pandas - это библиотека с открытым исходным кодом, обеспечивающая высокую производительность, легка в использовании структуры и инструментов анализа данных для языка программирования Python. Библиотека может считыватть данныезаписи в формате CSV , Excel, HDF, SQL, JSON, HTML и форматы Stata. Pandas хорошо подходит для работы с различными типами данных: Табличные данные со столбцами различных типов... Читать полностью...

Scikit-learn - машинное обучение на Python

Scikit-learn - машинное обучение на Python

Scikit-learn это библиотека для машинного обучения на языке программирования Python  с открытым исходным кодом. С помощью нее можно реализовать различные алгоритмы классификации, регрессии и кластеризации, в том числе алгоритмы SVM, случайного леса, k-ближайших соседей и DBSCAN, которые построены на взаимодействии библиотек NumPy и SciPy с Python. Достоинствами данной библиотеки являются: Простые ... Читать полностью...

20 популярных открытых проектов для машинного обучения

20 популярных открытых проектов для машинного обучения

Самыми популярными библиотеками для машинного обучения по количеству участников и активности изменений оказались scikit-Learn, PyLearn2 and NuPic. Python-проекты по машинного обучению на GitHub. Цветом отмечено отношение количества изменений  к количеству участников в проекте. Bob, IEPY, Nilearn и NuPIC имеют наивысшее значение. По данным KDnuggets Читать полностью...

PyBrain - хороший старт в нейроанализе

PyBrain - хороший старт в нейроанализе

Библиотека PyBrian написана на языке Python. Она реализует различные нейросетевые топологии – сети прямого распространения и рекуррентные нейронные сети. При необходимости можно создать топологию собственной структуры. Библиотека предоставляет исследователю гибкие, простые в использовании, но в то же время мощные инструменты для реализации задач из области машинного обучения, тестирования и сравне... Читать полностью...