3 Алтернативи на Kaggle за съвместна наука за данни

Кой е най-добрият начин да получите добър отговор на труден въпрос? Попитайте куп хора и направете състезание от това. Това отдавна е подходът на Kaggle към науката за данните: Превърнете тежките мисии, като например по-точното откриване на рак на белия дроб, в състезания, които плащат награди, където най-добрите отбори и най-добрите алгоритми печелят.

Сега Kaggle се търкаля в Google и макар всички признаци да сочат, че засега се запазва такъв, какъвто е, ще се разтревожат дългосрочните перспективи за сайт с толкова отдадена общност и идиосинкратичен подход.

Ето още три сайта, които споделят подобна мисия, ако не са изрично последвани по стъпките на Kaggle. (Обърнете внимание, че някои сайтове, като CrowdAnalytix, могат да обмислят приетите решения в конкурси като произведения под наем и по този начин тяхна собственост.)

CrowdAI

Продукт на École Polytechnique Fédérale de Lausanne в Швейцария, CrowdAI е платформа с отворен код за хостване на предизвикателства с отворени данни и получаване на представа как са били решени въпросните проблеми. Платформата е съвсем нова, като досега се предлагат само шест предизвикателства, но уроците, извлечени от тези предизвикателства, са подробни и ценни, като предоставят стъпка по стъпка методологии за възпроизвеждане на тази работа или създаване на нещо подобно. Съществуващите упражнения обхващат общи рамки като Torch или TensorFlow, така че е добро място за придобиване на практически подробности за тяхното използване.

DrivenData

DrivenData, създадена от консултантска компания, занимаваща се с професионални проблеми с данни, е домакин на онлайн предизвикателства с продължителност няколко месеца. Всеки от тях е фокусиран специално върху наболели проблеми, с които се сблъсква светът като цяло, като например предсказване на разпространението на болести или добив на Yelp данни за подобряване на процесите на проверка на ресторантите. Подобно на Kaggle, DrivenData също има борда за списък на работни места в областта на данните - функция, която хората се притесняват, може да изчезне от Kaggle след придобиване.

CrowdAnalytix

Подкрепен от инвеститори от Accel Partners и SAIF Partners, CrowdAnalytix се фокусира върху хостването на състезания за решаване на проблеми, основани на данни, вместо да споделя информация, която е резултат от тях. Предлагат се състезания за намиране на решения на проблеми в категории като моделиране, визуализация и изследвания и всеки от тях има награди в хиляди долари. Някои предишни предизвикателства включват прогнозиране на реалните разходи по искания за компенсация на работниците или закъснения на авиокомпаниите. Други състезания обаче не се организират за пари, а за предоставяне на конкурентна опция за изучаване на свързана дисциплина, като езика R.