Не бойтесь сабмитить задание. Чем раньше вы это сделаете, тем быстрее сможете понять, что не так с вашим алгоритмом.
Задумайтесь о данных: все ли их нужно использовать? не портят ли какие-нибудь сообщения результат? какие вы данные вообще перед собой видите и что они вам говорят?
Задумайтесь о фичах в вашей модели:
чем отличаются популярные посты от непопулярных? от чего они зависят?
Какой алгоритм использовать:
дает ли модель осмысленные результаты на проверочном множестве?
а вот и полезные ссылки: http://www.realtechsupport.org/UB/MRIII/papers/MachineLearning/Alppaydin_MachineLearning_2010.pdf https://www.coursera.org/course/ml http://simplystatistics.org http://www.r-bloggers.com http://www.datatau.com http://www.kdnuggets.com http://blog.revolutionanalytics.com/statistics
https://blogs.msdn.microsoft.com/arsen/2016/02/09/resolving-spark-1-6-0-java-lang-nullpointerexception-not-found-value-sqlcontext-error-when-running-spark-shell-on-windows-10-64-bit/ Еще несколько распространенных проблем:
...Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев