Русский
Русский
English
Статистика
Реклама

Подборки

Перевод 5 разных библиотек Python, которые сэкономят ваше время

12.06.2021 18:20:44 | Автор: admin

В этой подборке, переводом которой мы решили поделиться к старту курса о машинном и глубоком обучении, по мнению автора, каждая библиотека заслуживает отдельной статьи. Всё начинается с самого начала: предлагается библиотека, которая сокращает шаблонный код импортирования; заканчивается статья пакетом удобной визуализации данных для исследовательского анализа. Автор также касается работы с картами Google, ускорения и упрощения работы с моделями ML и библиотеки, которая может повысить качество вашего проекта в области обработки естественного языка. Посвящённый подборке блокнот Jupyter вы найдёте в конце.


PyForest

Когда вы начинаете писать код для проекта, каков ваш первый шаг? Наверное, вы импортируете нужные библиотеки. Проблема в том, что заранее неизвестно, сколько библиотек нужно импортировать, пока они вам не понадобятся, то есть пока вы не получите ошибку.

Вот почему PyForest это одна из самых удобных библиотек, которые я знаю. С её помощью в ваш блокнот Jupyter можно импортировать более 40 популярнейших библиотек (Pandas, Matplotlib, Seaborn, Tensorflow, Sklearn, NLTK, XGBoost, Plotly, Keras, Numpy и другие) при помощи всего одной строки кода.

Выполните pip install pyforest. Для импорта библиотек в ваш блокнот введите команду from pyforest import *, и можно начинать. Чтобы узнать, какие библиотеки импортированы, выполните lazy_imports().

При этом с библиотеками удобно работать. Технически они импортируются только тогда, когда вы упоминаете их в коде. Если библиотека не упоминается, она не импортируется.

Emot

Эта библиотека может повысить качество вашего проекта по обработке естественного языка. Она преобразует эмотиконы в их описание. Представьте, например, что кто-то оставил в Твиттере сообщение I [здесь в оригинале эмодзи "красное сердце", новый редактор Хабра вырезает его] Python. Человек не написал слово люблю, вместо него вставив эмодзи. Если твит задействован в проекте, придётся удалить эмодзи, а значит, потерять часть информации.

Вот здесь и пригодится пакет emot, преобразующий эмодзи в слова. Для тех, кто не совсем понял, о чём речь, эмотиконы это способ выражения через символы. Например, :) означает улыбку, а :( выражает грусть. Как же работать с библиотекой?

Чтобы установить Emot, выполните команду pip install emot, а затем командой import emot импортируйте её в свой блокнот. Нужно решить, с чем вы хотите работать, то есть с эмотиконами или с эмодзи. В случае эмодзи код будет таким: emot.emoji(your_text). Посмотрим на emot в деле.

Выше видно предложение I [эмодзи "красное сердце"] Python, обёрнутое в метод Emot, чтобы разобраться со значениями. Код выводит словарь со значением, описанием и расположением символов. Как всегда, из словаря можно получить слайс и сосредоточиться на необходимой информации, например, если я напишу ans['mean'], вернётся только описание эмодзи.

Geemap

Говоря коротко, с её помощью можно интерактивно отображать данные Google Earth Engine. Наверное, вы знакомы с Google Earth Engine и всей его мощью, так почему не задействовать его в вашем проекте? За следующие несколько недель я хочу создать проект, раскрывающий всю функциональность пакета geemap, а ниже расскажу, как можно начать с ним работать.

Установите geemap командой pip install geemap из терминала, затем импортируйте в блокнот командой import geemap. Для демонстрации я создам интерактивную карту на основе folium:

import geemap.eefolium as geemapMap = geemap.Map(center=[40,-100], zoom=4)Map

Как я уже сказал, я не изучил эту библиотеку настолько, насколько она того заслуживает. Но у неё есть исчерпывающий Readme о том, как она работает и что можно делать с её помощью.

Dabl

Позвольте мне рассказать об основах. Dabl создан, чтобы упростить работу с моделями ML для новичков. Чтобы установить её, выполните pip install dabl, импортируйте пакет командой import dabl и можно начинать. Выполните также строчку dabl.clean(data), чтобы получить информацию о признаках, например о том, есть ли какие-то бесполезные признаки. Она также показывает непрерывные, категориальные признаки и признаки с высокой кардинальностью.

Чтобы визуализировать конкретный признак, можно выполнить dabl.plot(data).

Наконец, одной строчкой кода вы можете создать несколько моделей вот так: dabl.AnyClassifier, или так: dabl.Simplefier(), как это делается в scikit-learn. Но на этом шаге придётся предпринять некоторые обычные шаги, такие как создание тренировочного и тестового набора данных, вызов, обучение модели и вывод её прогноза.

# Setting X and y variablesX, y = load_digits(return_X_y=True)# Splitting the dataset into train and test setsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)# Calling the modelsc = dabl.SimpleClassifier().fit(X_train, y_train)# Evaluating accuracy scoreprint(Accuracy score, sc.score(X_test, y_test))

Как видите, Dabl итеративно проходит через множество моделей, включая Dummy Classifier (фиктивный классификатор), GaussianNB (гауссовский наивный Байес), деревья решений различной глубины и логистическую регрессию. В конце библиотека показывает лучшую модель. Все модели отрабатывают примерно за 10 секунд. Круто, правда? Я решил протестировать последнюю модель при помощи scikit-learn, чтобы больше доверять результату:

Я получил точность 0,968 с обычным подходом к прогнозированию и 0,971 с помощью Dabl. Для меня это достаточно близко! Обратите внимание, что я не импортировал модель логистической регрессии из scikit-learn, поскольку это уже сделано через PyForest. Должен признаться, что предпочитаю LazyPredict, но Dabl стоит попробовать.

SweetViz

Это low-code библиотека, которая генерирует прекрасные визуализации, чтобы вывести ваш исследовательский анализ данных на новый уровень при помощи всего двух строк кода. Вывод библиотеки интерактивный файл HTML. Давайте посмотрим на неё в общем и целом. Установить её можно так: pip install sweetviz, а импортировать в блокнот строкой import sweetviz as sv. И вот пример кода:

my_report = sv.analyze(dataframe)my_report.show_html()

Вы видите это? Библиотека создаёт HTML-файл с исследовательским анализом данных на весь набор данных и разбивает его таким образом, что каждый признак вы можете проанализировать отдельно. Возможно также получить численные или категориальные ассоциации с другими признаками; малые, большие и часто встречающиеся значения. Также визуализация изменяется в зависимости от типа данных. При помощи SweetViz можно сделать так много, что я даже напишу о ней отдельный пост, а пока настоятельно рекомендую попробовать её.

Заключение

Все эти библиотеки заслуживают отдельной статьи и того, чтобы вы узнали о них, потому что они превращают сложные задачи в прямолинейно простые. Работая с этими библиотеками, вы сохраняете драгоценное время для действительно важных задач. Я рекомендую попробовать их, а также исследовать не упомянутую здесь функциональность. На Github вы найдёте блокнот Jupyter, который я написал, чтобы посмотреть на эти библиотеки в деле.

Этот материал не только даёт представление о полезных пакетах экосистемы Python, но и напоминает о широте и разнообразии проектов, в которых можно работать на этом языке. Python предельно лаконичен, он позволяет экономить время и в процессе написания кода, выражать идеи максимально быстро и эффективно, то есть беречь силы, чтобы придумывать новые подходы и решения задач, в том числе в области искусственного интеллекта, получить широкое и глубокое представление о котором вы можете на нашем курсе "Machine Learning и Deep Learning".

Узнайте, как прокачаться и в других специальностях или освоить их с нуля:

Другие профессии и курсы
Подробнее..

А контент они за меня тоже выберут? Как умная система рекомендаций студентам советы по учёбе даёт

06.05.2021 10:07:53 | Автор: admin

Весной 2021 проходит шестой запуск проектно-образовательных интенсивов Университета 20.35: студенты из 40+ вузов объединились в команды вокруг собственных идей или бизнес-задач от компаний и разрабатывают технологические решения. Звучит уже круто, а на практике ещё лучше. За три месяца участники проходят путь от идеи будущего продукта к его прототипу: знакомятся с экспертами рынков НТИ, питчат первые версии решений на хакатоне, знакомятся с другими участниками из университетов со всей страны, от Архангельска до Владивостока. В итоге каждая команда получает возможность развивать идею и дальше: защищать курсовые или дипломные работы по теме проекта, получать поддержку от вуза, входить в акселераторы, искать гранты и инвесторов, участвовать в конференциях.

Так за несколько лет и волн в интенсивах уже родились известные проекты портативной системы дезинфекции общественного транспорта, такси и каршеринга или приложения для определения заболевания у растений по фото.

Помимо проектной работы всем участникам открывается доступ в сетевое пространство непрерывного обучения с образовательными подборками и онлайн-курсами. Сегодня подход я не знаю, этого не было в программе, у меня лапки всё больше вызывает недоумение, поэтому студенты интенсивов сразу учатся мыслить в логике мне нужно чему-то научиться, чтобы сделать шаг развития. До этой весны участники выстраивали индивидуальную образовательную траекторию, либо пользуясь материалами Университета 20.35, либо самостоятельно подыскивая нужные курсы, лекции, книги. Но кто сказал, что систему Lifelong Learningа нельзя прокачать ещё больше? Ведь осознанный выбор с каждым днём делать всё труднее, особенно с учётом возросших объёмов контента на удаленке: количество открытых вкладок становится несоразмерно добываемым знаниям.

Умная система рекомендаций: сама найдёт, выберет, предложит

Платформа Университета 20.35 может автоматически подбирать и рекомендовать образовательный контент на основе

  • тем и целей, на которых хочет сфокусироваться пользователь,

  • задач, зафиксированных в таск-трекерах Trello или MS Teams.

Все участники получают чёткие рекомендации о том, как записывать свои цели, чтобы с каждым новым запросом система продолжала учиться и развиваться. Чем точнее и детальнее сформулирована задача, тем проще алгоритму найти что-то по-настоящему нужное.

Система уже умеет вытаскивать текст из:

  • карточек канбан-досок Trello и планировщика MS Teams в них работают команды, размечая свой прогресс в колонках To do, Doing и Done;

  • мессенджеров (slack, discord, zulip) коммуникативных пространств;

  • раздела Фокусы развития на платформе Университета 20.35 во время работы над проектом каждый может столкнуться с областями, которые ему не знакомы и интересны для изучения, например: agile или UX/UI дизайн. С помощью Фокусов пользователь целенаправленно фиксирует, чему хочет научиться, добавляя к записи специальные теги из тематических областей.

С помощью машинного обучения система анализирует запросы и задачи и автоматически подтягивает контент как из закрытых библиотек, доступных У20.35, так и открытых ресурсов.

https://drive.google.com/drive/u/0/search?q=фокус%20развития

Студентом можешь ты не быть, но получить рекомендацию обязан

Любой человек может стать пользователем образовательного пространства Университета 20.35, а значит получать рекомендации образовательного контента по поставленным целям. Чтобы разместить фокус развития, откройте страницу, зарегистрируйтесь в системе и добавьте запись.

Чтобы посмотреть полезный контент для ваших бизнес-процессов и проектов на досках Trello, зарегистрируйте проект на платформе Университета 20.35 в модуле People&Teams. Проектом будет тот комплекс задач, который требует образовательных рекомендаций.

Во время регистрации не забудьте прикрепить ссылку на таск-трекеры.

В итоге на странице персональных рекомендаций вы сможете изучать материалы как для ваших личных фокусов развития, так и для проекта.

Задавайте вопросы про персональные рекомендации в комментариях и делитесь опытом работы с нашей платформой.

Подробнее..

17 полезных ресурсов для маркетолога от директора по маркетингу и PR

28.12.2020 16:18:38 | Автор: admin

Привет, Хабр!

Я создатель канала marketing_jobs и работаю в сфере маркетинга уже 23 года. Маркетолог слишком уж разносторонняя личность, поэтому многие новички или недавние выпускники не знают за что хвататься. И даже если специалист углубляется в одну сферу, например, контент или SEO, понимание, как работают другие подразделения жизненно необходимо. Очень важно быть в курсе того, что происходит в сфере. Каждый день появляется что-то новое, но есть некоторые ресурсы, книги и фильмы, которые не просто полезны в работе, а основополагающие, особенно для начинающих маркетологов. Я их разбил на так называемые номинации, постарался ранжировать от общего к специализированному:

1. Для PR-щика

Люблю и регулярно пересматриваю нестареющую и актуальную классику фильм Хвост виляет собакой (в российском прокате Плутовство). Полезно понимать, как устроен мир PR-а.

Кадр из фильма "Хвост виляет собакой"Кадр из фильма "Хвост виляет собакой"

2. Для тех, кто хочет понять как устроена работа в больших корпорациях

Посмотрите хоть раз сериал Карточный домик. Почти все применимо на практике либо вами, либо вашими соперниками.

3. Для тех, кто хочет писать правильные тексты

Считаю книгу Пиши, сокращай Максима Ильяхова и Людмилы Сарычевой крайне полезной. Для меня это настольная книга, к которой я регулярно обращаюсь в своей практике. У Максима, к слову, есть свой телеграм-канал Главред очень полезный.

4. Для бренд-менеджеров, CMO, CEO и всех небезразличных

Не забывайте классику. Маркетинг снизу вверх Эла Райса и Джека Траута на 100% ею является. Напоминайте себе периодически про важность вашего бизнес- и бренд-позиционирования.

5. Для SMM-щика

Конференция Суровый Питерский SMM собирает у себя известных экспертов по продвижению в социальных сетях. Посмотреть все доклады временно затратно, но если выбрать самые актуальные - можно понять, что новенького появилось на этом рынке.

6. Тренды в целом

Тут все просто. Подписан на vc.ru, читаю 75% материалов на портале. Надо бы знать, чем живет современный венчурный капиталист.

7. Для понимания интернет-трендов

Бесплатный сервис, о котором многие забывают Google Trends. За несколько кликов можно определить популярность товара, его сезонность, географию поиска плюс сравнить запросы конкурентов.

8. Хочу быть в курсе событий

Телеграм-канал Русский маркетинг. Много полезного о digital и медиа для маркетологов. Уверен, каналов подобных немало, но по какой-то причине читаю именно его.

9. Иностранные профильные онлайн-СМИ

Отраслевые новости на английском ищу на американском сайте Adweek или европейском медиа The Drum.

10. Учимся воспринимать специализированную лексику на слух

Английский нужен всем, не только маркетологам. Но из профессиональных подкастов можно вытащить стандартные рабочие фразы и сленг. Для начала послушайте This Old Marketing Podcast.

11. Где найти профессионалов в области маркетинга

hh это хорошо, но есть и не хуже. Достаточно давно предпочитаю отслеживать тенденции на HR-рынке маркетинга в Телеграме. В качестве примера можно перечислить и мой канал Marketing jobs с вакансиями для маркетологов, и канал с большим охватом с вакансиями на удаленку Finder.vc, ну, и канал Алены Владимирской, где попадаются действительно интересные вакансии.

12. Где тренировать насмотренность

Платформу для дизайнеров, художников, фотографов и т.д. Behance рекомендую просматривать регулярно для понимания визуальных трендов. Лучшие работы ежедневно отбираются кураторами и отображаются на главной странице сайта. Еще могу посоветовать Pinterest, ну и, конечно, не стоит сбрасывать со счетов банальный Гугл-поиск по картинкам на интересующую вас тематику.

Сайт BehanceСайт Behance

13. Где искать идеи для рассылки

Огромная коллекция готовых примеров email-писем хранится на сайте Reallygoodemails. Очень облегчает работу и выручает, когда нужно найти что-то свежее.

14. Для понимания, куда уходит рекламный бюджет

Как только бизнес достаточно масштабируется, подключается она сквозная аналитика. Лучше не пренебрегать этой метрикой, чтобы точнее оценивать реальную эффективность рекламы. Бизнес-сервисов много, один из самых популярных сервисов, пожалуй, Roistat.

15. Для всех, кто работает с большим количеством разных задач

Люблю фразу Пожар идет по плану за ее емкость и остроту боли. И чтобы все шло действительно по плану - Trello - вот мой выбор, пробовал разное, но всегда что-то не устраивало. Трелло же решает все мои потребности. Все профильные подразделения имеют свою доску, к которой подключены внутренние заказчики и партнеры. Удобно и продуктивно. Аналогов Трелло, тем не менее, очень немало - выбирайте. Настоятельно рекомендую одно - вести дела гораздо легче с применением подобных инструментов планирования и командного взаимодействия.

16. В помощь PR-щику

Прессфид делает жизнь каждого PR-щика немного проще. Благодаря сервису журналист получает фактуру, а компания или эксперт упоминание в СМИ.

17. Когда нужно размять мозг

Наконец, если какому-то проекту или команде не хватает мозгового штурма, то выручают интеллект-карты, или майдмэппинг. Попробуйте творчески подойти к решению задачи. Инструменты MindMeister или Coggle удобны в использовании.


Надеюсь, статья была вам полезной, и вы захотите добавить в комментариях другие ресурсы, которые, на ваш взгляд, стоит знать каждому маркетологу.

Подробнее..

Категории

Последние комментарии

  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru