Как научиться чему-то новому и не попасть на разводку

(Остап Бендер в помощь)

Posted by snakers41 on March 15, 2017

[Правки 1.3]

Так случилось, что с профессиональной точки зрения я всегда работал с данными, которые или "закрепощены" в рамках моего ПК (пример - обработка данных при написании научных статей или какой-либо банальный финансовый анализ или банальный стат. анализ данных в экселе) или рамках БД на SQL (с определенными извращениями, конечно).

При этом приходилось сталкиваться с задачами, очевидного решения которых я не видел с помощью своего набора инструментов. То есть алгоритм анализа мне понятен, но, к примеру, сочетание PostgreSQL + PHP для решения такой задачи не подходит, потому что:

i) уйдет много времени на "быдло-код";

ii) гонять регрессии в PHP не очень православно (коммьюнити Python гораздо "живее" и примерами полнится интернет);

iii) перемножать матрицы в БД немного похоже на святотатство (хотя при определенных обстоятельствах может это и будет работать);

iv) писать много быдло-кода для задачи "на 15 минут" смерти подобно;

v) руками делать каждый день через CSV выгрузки-загрузки в Eviews - еще хуже;

И так получилось, что со временем пришло четкое осознание фактов, что:

  • Навыки финансового анализа должного уровня либо коммодитизируются, либо не пользуются спросом, т.к. проекты у нас зачастую оцениваются "правильно" не там, где все остальное делается "правильно" (проще говоря - либо все делается через жопу, либо людям нужен человек, который до 50 лет будет только DCF считать);
  • Навыки программирования с ростом популярности высокоуровневых языков - тоже коммодити. Не даром есть всякие шутки про "ко-ко-ко", "веб-макак", "байтослесарей" и прочее. Если вы не готовы "закоптиться" в 2-3 из интересных вам технологий и разбирать legacy-треш (берите Яву - она самая дорогая, и не очень сложная) и видеть код 99% времени и работать на dead end job и быть замененным следующим поколением "молодых специалистов" с минимальной з/п и 99% времени "развиваться чтобы не отстать", вероятно это тоже не про вас. Я не говорю, что написание кода и программисты это плохо, я говорю, что алгоритмы вечны, а код - только инструмент со своим жизненным циклом. Также просмотр заказов на фриланс-биржах подсказывает, что 90% людей юзает одноразовые фреймворки или 1С и готово платить 100-200 рублей в час;
  • Внезапно, если вы захотите работать не в Noname компании, то вас будут оценивать...не очень разбирающиеся в теме люди по ключевым словам, которых не понимают (смотрите ссылку выше про программиста);
  • В качестве иллюстраций приведу пару скриншотов из курса, который сейчас слушаю. Курс про работу с данными, но сколько времени вы тратите на разбирание "говн" других людей на своей работе вместо реальной работы, товарищи?

Автор намекает нам, что суть важнее реализации. Хоть рынок это буйное безумие, а искать на работу вас будут по формальному признаку (если нет пары мультов, чтобы проверить рыночную гипотезу самому), намек на то, что инструмент освоить быстрее, чем понять суть.



Биологи пишут SQL запросы, потому что это эффективно и они понимают зачем это делают. Я бы убил за такое форматирование, но суть в том, что лучше написать работающий запрос криво, чем неработающий красиво.



90% времени ученые США борются с чисткой данных, а не "наукой".


Также во всех проектах / мини-проектах, которые "взлетали", ключевую роль ВСЕГДА играл быстрый и качественный доступ к статистике / знаниям / данным / решениям (если решения принимаются месяцами, задумайтесь). Причем важно понимать, что у доступа могут быть разные элементы:

  • Скорость записи и чтения данных;
  • Подходящая инфраструктура для хранения и передачи данных;
  • Скорость понимания, что именно лежит там и почему;
  • И естественно скорость анализа и делания выводов;

Если в каком-либо из этих вещей есть загвоздка, то все остановится. Собственно по этой причине я решил также изучить способы программной работы с данными и алгоритмами, которые не будут стеснены ограничениями выше и позволят там где надо просто посчитать среднее значение, а где надо - посчитать что-то более объемное. Выбор пал на такие вещи (алгоритмы и инструменты) как машинное обучение, питон и его либы, octave + noSQL инструменты хранения данных (с SQL вопросов нет).

Итог небольшого гугления подсказал мне таких "товарищей": http://newprolab.com/bigdata, которым я ради интереса написал. Это была прелюдия. А сейчас - более интересное.



Вот оно, образование моей мечты!


Первым звоночком было то, что ребята на хабре странно отзывались про преподавателей и то, как их менеджер отвечал на вопросы - никакой дополнительной информации в течение 2-3 писем, только "у вас есть один день на скидку 15%".

Вторым звоночком было то, что ребята просят предоплату в течение 1 дня с начала общения в размере 180 тыс. рублей. При этом аналогичные курсы на Coursera от ведущих вузов мира (!!!) стоят на порядок-два меньше (!!!), а аналогичный курс Яндекса берет исключительно мягко-говоря "математических задротов" из технических вузов с огромным конкурсом (читайте выше про молодых специалистов).

Третьим звоночком был юридический анализ договора - обязанности оплаты в течение 1 суток против нулевых обязанностей по предоставлению "услуг" с другой стороны (могу выслать по запросу с перепиской).

Четвертым звоночком было требование дать по электронной почте мои персональные данные (паспорт) без какого-либо доказательства того, что их не будут использовать неправомерно (судя по всему раздел про данные в мой документ дописали в последний момент судя по его расположению и длине).

Пятым звоночком была рассылка от имени их компании с их домена и криво прописанными тегами (username@newprolab.com через mail202.wdc02.mcdlv.net ) такого содержания (ниже), что очень сильно противоречит тому, что говорил менеджер (похожий пример - а пятница-то не черная совсем).



Если вы не поняли - мое предположение состоит в том, что такой курс мягко говоря брать не надо.

Если просуммировать мои мысли:

  • В современном мире все коммодитизируется. Ваша работа тоже. Бойтесь и думайте, как быть и куда бежать. Нефть не вечна (если, конечно, "кредитопомойка" и "ипотека на полвека" с "айфоном" - не ваш потолок мечтаний в жизни);
  • Если хотите учиться - вам придется страдать / искать / читать книги / ковырять форумы / копаться в документации информационном мусоре (откройте свой диплом, и вспомните сколько там полезного из всех часов);
  • Есть много людей, которые хотят помочь вам расстаться с непосильно нажитым имуществом, просто они очень красиво маскируются. Заседание начинается!
  • Выучите английский и дуйте на Coursera / на торренты / в библиотеку / в гугл / в книжный магазин / в матан;

Список дельных курсов по теме:

  1. https://www.coursera.org/specializations/jhu-data-science;
  2. https://www.coursera.org/specializations/data-science-python;
  3. https://www.coursera.org/specializations/data-science;
  4. https://www.coursera.org/learn/python-data-analysis;


Что характерно, эта скидка потом ВНЕЗАПНО стала действовать и до 15 января и до 15 февраля....настоящие скидки такие настоящие, аж больно!