SDCast

SDCast


SDCast #50: в гостях Иван Гуз, директор аналитического департамента в Avito

November 30, 2016

На этот раз речь пойдет об аналитике, анализе больших данных, машинном обучении и прочих смежных темах. У меня в гостях Иван Гуз, директор аналитического департамента в АВИТО.
По традиции, в начале Иван рассказал немного про себя, о том, как и почему он ушел из большого enterprise мира в, тогда еще, стартап под названием «АВИТО» и что представляет Авито из себя сейчас. Рассказал про разные аналитические задачи, которые он и его команда решают, среди которых, например, анализ поведения пользователя на сайте, распознавание дубликатов товаров, дифференциация реальных пользователей и ботов и многие другие.
Не обошли мы стороной и техническую составляющую: Иван рассказал про то, какие инструменты, языки программирования, тулкиты и фреймворки они используют для решения своих задач.

Ссылки на ресурсы по темам выпуска:
scikit-learn. Machine Learning in Python: http://scikit-learn.org
pandas. Python Data Analysis Library: http://pandas.pydata.org/
XGBoost. Optimized distributed gradient boosting library: https://github.com/dmlc/xgboost
TensorFlow is an Open Source Software Library for Machine Intelligence: https://www.tensorflow.org/
ImageNet is an image database organized according to the WordNet hierarchy: http://image-net.org/
Прошедшие конкурсы по машинному обучению от Авито на Kaggle: https://www.kaggle.com/competitions?sortBy=deadline&group=all&page=1&segment=allCategories&search=avito