Публикации по теме 'data'


Что такое DVC (Контроль версий данных) и как начать?
Всегда использовать систему контроля версий, такую ​​как Git, для исходного кода - это хорошая практика и отраслевой стандарт. Но отслеживание больших данных в Git становится невозможным. Проекты с большим объемом данных, такие как проекты глубокого обучения, в значительной степени зависят от качества набора данных для получения результатов. Тогда какое решение? Есть ли такой подход, как управление версиями данных? Да, проект Data Version Control ( DVC ) направлен на внедрение Git в..

Введение в линейную регрессию - единственная функция
Линейная регрессия - это метод статистического анализа данных, который помогает вам создавать прогнозы для ваших пользовательских данных путем предварительного обучения модели на каком-либо имеющемся наборе данных. Давайте разберем это на примере. Предположим, у меня есть данные о цене дома с учетом его площади. Теперь, если я хочу оценить стоимость дома площадью около 400 единиц, как я могу это предсказать? Здесь на помощь придет линейная регрессия. Мы создадим модель,..

ODSC West 2019 Keynote Dawn Song об искусственном интеллекте и безопасности
Ставки для ИИ и безопасности сейчас выше, чем когда-либо. После основного доклада Сепиде Сейфзаде об управлении жизненным циклом ИИ на сцену вышла Дон Сонг из лаборатории BAIR Калифорнийского университета, чтобы обсудить важный, но часто упускаемый из виду компонент жизненного цикла ИИ: безопасность, особенно с глубоким обучением, и то, как ставки становятся все выше по мере того, как ИИ становится более интеллектуальным. Мы часто слышим о различных проблемах безопасности в новостях,..

Сравнение разных форматов файлов в больших данных
При обработке данных существуют различные типы форматов файлов для хранения наборов данных. Каждый формат имеет свои плюсы и минусы в зависимости от вариантов использования и существует для одной или нескольких целей. Важно знать и использовать их особенности при выборе конкретного типа формата. Некоторые форматы больше подходят для определенных видов использования или обработки, таких как бизнес-аналитика, сетевое взаимодействие, веб-приложение, пакетная или потоковая обработка...

Разница между обучением с учителем и обучением без учителя.
В этом блоге я кратко рассмотрю базовое определение контролируемых и неконтролируемых алгоритмов обучения. Надеюсь, этот блог может быть полезен для тех, кто только начал изучать машинное обучение. Что такое машинное обучение (ML)? Прежде чем мы перейдем к разделу контролируемого и неконтролируемого обучения, давайте поговорим о машинном обучении. Машинное обучение можно описать как подмножество искусственного интеллекта, а мощность машинного обучения определяется извлечением..

? - isa (graql, логическая_программа)
Это сообщение для сообщества логического программирования . Если вам нравится выражать модели в виде набора логических правил, а вычисления в вашем мире - это вывод, продолжайте читать. Если вы не знаете, что такое логическое программирование, все равно продолжайте читать: я постараюсь сохранить это самодостаточным. Grakn - это база данных распределенных графов со встроенной системой представления знаний и рассуждений (KRR). Это дает ему топологические / связные / структурные..

Изучение взаимодополняющей современной архитектуры данных машинного обучения и обслуживания…
Машинное обучение (МО) расширяет возможности архитектуры данных и, несомненно, объединяет специалистов по функциональным вопросам, инженеров данных (DE) и специалистов по данным (DS) для совместной работы. Задачи : Фрагментарная разработка ML, дублирующая процесс обучения и вызывающая такие проблемы, как совместимость и неоднозначность (несогласованные метаданные) с платформой данных. Использование традиционных методов «хранилища данных» при разработке решений машинного обучения...