Подписывайтесь на наш Telegram-канал! Ежедневно интересно!

Подписывайтесь на наш Telegram-канал!

Помочь нашему сайту финансово на сервисе сбора донатов!

Помочь нашему сайту финансово!
 
Текущий раздел Скачать бесплатно » Книги » Программирование » Pandas for Everyone: Python Data Analysis, Second Edition
HostLife - лучший платный хостинг

Pandas for Everyone: Python Data Analysis, Second Edition

  • Заявить о правах (Abuse)
Автор: Limpopo5 от 2022-11-23, 02:28:44
Pandas for Everyone: Python Data Analysis, Second EditionНазвание: Pandas for Everyone: Python Data Analysis, Second Edition
Автор: Dаnіеl Сhеn
Издательство: Addison-Wesley Professional/Pearson Education
Год: 2023
Страниц: 512
Язык: английский
Формат: epub
Размер: 57.3 MB

Manage and Automate Data Analysis with Pandas in Python.

Today, analysts must manage data characterized by extraordinary variety, velocity, and volume. Using the open source Pandas library, you can use Python to rapidly automate and perform virtually any data analysis task, no matter how large or complex. Pandas can help you ensure the veracity of your data, visualize it for effective decision-making, and reliably reproduce analyses across multiple data sets.

Pandas for Everyone, 2nd Edition, brings together practical knowledge and insight for solving real problems with Pandas, even if you’re new to Python data analysis. Daniel Y. Chen introduces key concepts through simple but practical examples, incrementally building on them to solve more difficult, real-world data science problems such as using regularization to prevent data overfitting, or when to use unsupervised machine learning methods to find the underlying structure in a data set.

Pandas is an open-source Python library for data analysis. It gives Python the ability to work with spreadsheet-like data for fast data loading, manipulating, aligning, merging, etc. To give Python these enhanced features, Pandas introduces two new data types to Python: Series and DataFrame. The DataFrame will represent your entire spreadsheet or rectangular data, whereas the Series is a single column of the DataFrame. A Pandas DataFrame can also be thought of as a dictionary or collection of Series.

Why should you use a programming language like Python and a tool like Pandas to work with data? It boils down to automation and reproducibility. If there is a particular set of analyses that needs to be performed on multiple data sets, a programming language can automate the analysis on the data sets. Although many spreadsheet programs have their own macro programming languages, many users do not use them. Furthermore, not all spreadsheet programs are available on all operating systems. Performing data tasks using a programming language forces the user to have a running record of all steps performed on the data. I, like many people, have accidentally hit a key while viewing data in a spreadsheet program, only to find out that my results do not make any sense anymore due to bad data. This is not to say spreadsheet programs are bad or do not have their place in the data workflow. They do, but there are better and more reliable tools out there. These better tools can work in tandem with spreadsheet programs while providing more reliable data manipulation, and introduce the possibility of incorporating data from other data sets and databases.

New features to the second edition include:

Extended coverage of plotting and the seaborn data visualization library
Expanded examples and resources
Updated Python 3.9 code and packages coverage, including statsmodels and scikit-learn libraries
Online bonus material on geopandas, Dask, and creating interactive graphics with Altair

Chen gives you a jumpstart on using Pandas with a realistic data set and covers combining data sets, handling missing data, and structuring data sets for easier analysis and visualization. He demonstrates powerful data cleaning techniques, from basic string manipulation to applying functions simultaneously across dataframes.

Once your data is ready, Chen guides you through fitting models for prediction, clustering, inference, and exploration. He provides tips on performance and scalability and introduces you to the wider Python data analysis ecosystem.

Work with DataFrames and Series, and import or export data
Create plots with matplotlib, seaborn, and pandas
Combine data sets and handle missing data
Reshape, tidy, and clean data sets so they’re easier to work with
Convert data types and manipulate text strings
Apply functions to scale data manipulations
Aggregate, transform, and filter large data sets with groupby
Leverage Pandas’ advanced date and time capabilities
Fit linear models using statsmodels and scikit-learn libraries
Use generalized linear modeling to fit models with different response variables
Compare multiple models to select the “best” one
Regularize to overcome overfitting and improve performance
Use clustering in unsupervised Machine Learning

Скачать Pandas for Everyone: Python Data Analysis, Second Edition






Выгодные предложения от нашего партнёра ИГ "ЭКСМО-АРТ":

Акция С заботой о здоровье и безопасности




 


BooksKeeper - электронная библиотека, ежедневно пополняемая нашими авторами.
Все материалы, представленные на нашем сайте, Вы сможете скачать по ссылкам различных бесплатных файлообменников совершенно бесплатно!
Инструкции, поясняющие, как надо качать бесплатно с файлообменников смотреть тут
Регистрация на нашем сайте позволит Вам добавлять свои книги, а также комментировать опубликованные книги, общаться с нашими авторами.
Для этого мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

HostLife - лучший платный хостинг
HostLife - лучший платный хостинг!
Отличный хостинг по цене от 1.87$/месяц! Рекомендация от сайта Bookskeeper!


Бесплатная электронная библиотека. Скачать книги бесплатно!
Текущий раздел Скачать бесплатно » Книги » Программирование » Pandas for Everyone: Python Data Analysis, Second Edition

Наша электронная библиотека Bookskeeper (для РФ работает через VPN) - это интернет-витрина, где любой посетитель может публиковать электронные варианты книг, журналов, газет, комиксов, в общем, любой литературы со ссылками для медленного, но бесплатного скачивания с файлообменников. В нашем книжном хранилище Вы всегда найдете литературу на любой вкус человека любого возраста - от детских комиксов и расскрасок до серьезной научной литературы.
 
 
Поддержите наш сайт!
Идет сбор донатов на хостинг
для работы нашего сайта.
Сканируйте QR-код
(или нажмите на него)
для Вашей поддержки!
Оплата картой, ЮMoney


Донаты для помощи нашему сайту!

ОГРОМНОЕ СПАСИБО
всем за Ваши донаты!

Наши рекомендации



Book24.ru - книжный интернет магазин



Turbobit - Получите турбо-доступ и скачивайте безлимитно и без рекламы!


HostLife - лучший платный хостинг



 
 

Топ публикаций

 
  • Exotic - № 42024
  • Дилетант №4 (100) 2024
  • Барин. Цикл из 2 книг
  • Последний попаданец. Цикл из 11 книг
  • Vivere Country №172 2024
  • Легендарные грузовики СССР №91 КШМ-Р-142М (ГАЗ-66) (2024)
  • Книга пяти колец. Цикл из 6 книг
  • Земляной А. - Страж. Цикл из 3 книг
  • Десять Принцев Российской Империи. Цикл из 6 книг
  • Наши автобусы. Спецвыпуск №11 2024
  • Selber Machen №6 2023
  • Чайка Д. - Третий Рим. Цикл из 10 книг
  • Барьер Ориона. Цикл из 2 книг
  • СССР 2010. Цикл из 6 книг
  • Провинциал. Цикл из 4 книг
  • Дворянская кровь. Цикл из 3 книг
  • Машины и Механизмы №4 2024
  • Жандарм. Цикл из 5 книг
  • "Приусадебное хозяйство" № 4 2024 с приложениями
  • Глас Плеяды. Цикл из 4 книг
  • Зарубежное Военное Обозрение №4 2024
  • Игра Хаоса. Цикл из 14 книг
  • Риддер А. - Техномаг. Цикл из 3 книг
  • Идеальный мир для Лекаря. Цикл из 15 книг
  • Selber Machen - Mai 2024
  • Кровь Василиска. Цикл из 2 книг
  • UPgrade №2 (март 2024)
  • Легендарные грузовики СССР №93 ЯАЗ-210Е (2024)
  • Титан империи. Цикл из 3 книг
  • Вик Разрушитель. Цикл из 6 книг
  •