Articles | SQL-Ex blog

Понимание планов в PostgreSQL

Добавил Sergey Moiseenko on Среда, 24 апреля. 2024

Пересказ статьи Muhammad Ali. Understand Explain Plans in PostgreSQL

В предыдущей статье мы обсуждали утилиту pg_stat_statements - инструмент для идентификации запросов, интенсивно использующих ресурсы - памяти, ЦП или ввода/вывода.

Теперь предположим, что вы определились с запросами, которые хотите исследовать дальше. Команда EXPLAIN используется для генерации планов выполнения. Она включает:

Продолжить чтение "Понимание планов в PostgreSQL"

Упражнение Pandas для специалистов по данным — часть 2

Добавил Sergey Moiseenko on Суббота, 20 апреля. 2024

Пересказ статьи Avi Chawla. Pandas Exercise for Data Scientists — Part 2

Библиотека Pandas всегда привлекала специалистов по данным своими изумительными возможностями. Она несомненно является важным инструментом для обработки и манипуляции данными.

Поэтому для расширения ваших экспертных знаний и знакомства с огромным числом популярных среди специалистов по данным функций Pandas я представляю вторую часть "Упражнение Pandas". Первую часть вы можете найти по ссылке.
Продолжить чтение "Упражнение Pandas для специалистов по данным — часть 2"

Не используйте DISTINCT в качестве "исправления join"

Добавил Sergey Moiseenko on Среда, 17 апреля. 2024

Пересказ статьи Aaron Bertrand. Don’t use DISTINCT as a “join-fixer”

Я спокойно решал проблемы производительности, переписывая медленные запросы, чтобы избежать использования DISTINCT. Зачастую DISTINCT служит лишь для того, чтобы "исправить join", и я могу объяснить что это означает на примере.

Продолжить чтение "Не используйте DISTINCT в качестве "исправления join""

Использование substring в MySQL на примерах

Добавил Sergey Moiseenko on Суббота, 13 апреля. 2024

Пересказ статьи Rahul Mehta. MySQL substring uses with examples

Введение

MySQL, как и любые другие базы данных, может хранить данные различных типов. Одними из наиболее часто используемых типов данных являются строки. Разработчики широко используют эти типы для хранения данных, а также в различных операциях форматирования. Мы будем часто сталкиваться с требованием получения части строки. MySQL предоставляет функцию “SUBSTRING” для извлечения подстроки из строки. Имеются следующие варианты для извлечения строки:

SUBSTRING

SUBSTR (синоним для SUBSTRING)

SUBSTRING_INDEX

Давайте начнем с понимания того, как работает substring.
Продолжить чтение "Использование substring в MySQL на примерах"

Как работает секционирование в PostgreSQL и почему вас это должно беспокоить?

Добавил Sergey Moiseenko on Среда, 10 апреля. 2024

Пересказ статьи Adam Furmanek. How Does Partitioning Work in PostgreSQL and Why Should You Care?

Секционирование позволяет разделить логически одну большую таблицу на физические таблицы меньших размеров. Это может улучшить производительность запросов, обеспечивая доступ к меньшему числу строк, оптимизируя чтения со случайным доступом и используя очень таргетированные индексы. Давайте посмотрим, как это работает в PostgreSQL и как Metis их обрабатывает.

Продолжить чтение "Как работает секционирование в PostgreSQL и почему вас это должно беспокоить?"

Понимание индекса SQL: ключ к быстрому выполнению запросов

Добавил Sergey Moiseenko on Суббота, 6 апреля. 2024

Пересказ статьи Kishan Modasiya. Understanding SQL Index: The Key to Faster Query Execution

Индекс - это очень важная тема в SQL. И очень большая для того, чтобы рассмотреть ее в одной статье. Здесь я дам краткий обзор понятия индекса, что это такое и почему он так необходим, рассмотрю типы индексов и то, как индексы помогают оптимизировать производительность запросов на ряде примеров. Я буду выдерживать эту статью понятной для новичков и не углубляться в тему. Итак, начнем. Продолжить чтение "Понимание индекса SQL: ключ к быстрому выполнению запросов"

Понимание языка управления данными SQL: GRANT и REVOKE

Добавил Sergey Moiseenko on Среда, 3 апреля. 2024

Пересказ статьи DataScience Nexus. Understanding SQL Data Control Language: GRANT and REVOKE

Структурированный язык запросов (SQL) является мощным языком управления и манипуляции данными в реляционных базах данных. В то время как язык определения данных (DDL) и язык манипуляции данными (DML) являются наиболее используемыми составляющими SQL, язык управления данными (DCL) играет решающую роль в управлении доступом пользователей и разрешениях в пределах базы данных. Здесь мы будем разбираться в DCL и сфокусируемся на двух ключевых операторах - GRANT и REVOKE. Эти операторы исключительно важны для управления и обслуживания прав пользователя в пределах базы данных. Давайте вникать в область разрешений и привилегий SQL. Продолжить чтение "Понимание языка управления данными SQL: GRANT и REVOKE"

Возможности функции Crosstab в Pandas для анализа и визуализации данных

Добавил Sergey Moiseenko on Суббота, 30 марта. 2024

Пересказ статьи R. Gupta. The Power of Crosstab Function in Pandas for Data Analysis and Visualization

Pandas является популярной библиотекой Python для анализа и манипуляции данными. Она предоставляет мощные инструменты для работы с табличными данными, включая такие структуры как ряды и фреймы данных, и функции для очистки, слияния и изменения формы данных.

Одним из наиболее полезных инструментов для анализа табличных данных в Pandas является функция crosstab(). Эта функция позволяет вам рассчитать таблицу частот двух и более переменных, которые суммируют разбросанные в данных значения и позволяют выявить связь между переменными. Перекрестная табуляция (или crosstab) является важным инструментом для анализа двух категориальных переменных в наборе данных. Она дает сводную таблицу распределения частот двух переменных, позволяя увидеть взаимосвязь между ними и идентифицировать любые шаблоны или тренды. Продолжить чтение "Возможности функции Crosstab в Pandas для анализа и визуализации данных"

Причины скачков производительности запроса в SQL Server

Добавил Sergey Moiseenko on Среда, 27 марта. 2024

Пересказ статьи Aaron Bertrand. Reasons for SQL Server Query Performance Fluctuations

Производительность запроса может испытывать скачки с течением времени, и это не обязательно обусловлено изменениями в самом запросе (или в коде приложения, которое его вызывает). Пользователи часто спрашивают, почему запрос внезапно стал работать медленнее, хотя они ничего не меняли в приложении, а данные не изменялись резко. В этой статье мы укажем на несколько причин - их существует много - по которым запрос мог замедлиться сегодня по сравнению с тем, что было 10 минут назад, две недели назад, или прошлым летом.

Прежде чем вникать в возможные причины скачков производительности, давайте сделаем обзор того, что происходит в SQL Server при обработке запросов.

Продолжить чтение "Причины скачков производительности запроса в SQL Server"

Индексы PostgreSQL: что это такое и как они могут помочь

Добавил Sergey Moiseenko on Суббота, 23 марта. 2024

Пересказ статьи Henrietta Dombrovskaya. PostgreSQL Indexes: What They Are and How They Help

В предыдущей статье этой серии мы узнали, как произвести, прочитать и интерпретировать планы выполнения. Мы узнали, что план выполнения предоставляет информацию о методах доступа, которые PostgreSQL использует для выборки записей из базы данных. В частности, мы видели, что в некоторых случаях PostgreSQL использовал последовательное сканирование, а в некоторых - доступ на основе индекса.

Кажется, что было бы неплохо поговорить об индексах до обсуждения планов выполнения, но планы запросов - это хорошее место для начала движения в сторону решения проблем производительности! Здесь мы собираемся поговорить об индексах, зачем они нам нужны, как они могут нам помочь, и как они могут усугубить ситуацию.
Продолжить чтение "Индексы PostgreSQL: что это такое и как они могут помочь"

Nidhi Gupta. DECODE vs CASE IN ORACLE

Добавил Sergey Moiseenko on Среда, 20 марта. 2024

Пересказ статьи Nidhi Gupta. DECODE vs CASE IN ORACLE

DECODE: Decode - это функция в SQL. Это способ преобразования написанного кода в понимаемый язык.

CASE: Case - это оператор в SQL. Это способ реагирования на появление значения или на то, какое действие необходимо выполнить при появлении определенного значения.
Продолжить чтение "Nidhi Gupta. DECODE vs CASE IN ORACLE"

Нормализуйте строки для оптимизации пространства и поиска

Добавил Sergey Moiseenko on Суббота, 16 марта. 2024

Пересказ статьи Aaron Bertrand. Normalize strings to optimize space and searches

Эта статья написана для SQL Server, однако эти понятия применимы к любой платформе реляционных баз данных.

Социальная сеть Stack Exchange журнализует большой веб-трафик - даже в сжатом виде мы в среднем имеем свыше терабайта в месяц. И это всего лишь суммарный срез наших общих необработанных данных журнала, который мы загружаем в базу данных для обеспечения безопасности и аналитических целей. На каждый месяц имеется своя собственная таблица, позволяя использовать скользящие окна секционного типа и селективные индексы без дополнительных ограничений и накладных расходов на обслуживание. (Taryn Pratt рассказывает об этих таблицах весьма подробно в своей статье Migrating a 40TB SQL Server Database.)
Продолжить чтение "Нормализуйте строки для оптимизации пространства и поиска"

Параллелизм базы данных в PostgreSQL

Добавил Sergey Moiseenko on Среда, 13 марта. 2024

Пересказ статьи Mohan Saraswatipura. Database Concurrency in PostgreSQL

Управление параллелизмом является важным аспектом в системах баз данных, которые имеют дело с множеством параллельно выполняющихся транзакций. В PostgreSQL применяются различные методы для обеспечения параллельного доступа к базе данных при поддержке согласованного состояния данных с использованием свойств атомарности и изоляции ACID (атомарность, согласованность, изоляция и длительность).
Продолжить чтение "Параллелизм базы данных в PostgreSQL"

Продвинутый Pandas: исчерпывающее руководство для энтузиастов данных

Добавил Sergey Moiseenko on Суббота, 9 марта. 2024

Пересказ статьи RaviTeja G. Advanced Pandas: A Comprehensive Handbook for Data Enthusiasts

Это вторая часть нашего руководства по науке о данных с Pandas. В части 1 мы заложили основы изучения структур данных, загрузки данных, очистки, выборки, индексации и манипуляции данными. Однако исследование данных на этом не заканчивается, правильно?

Теперь, во второй части, мы рассмотрим более продвинутые темы агрегации данных, анализа, визуализации, обработки данных временных рядов и другие. Продолжить чтение "Продвинутый Pandas: исчерпывающее руководство для энтузиастов данных"

Что такое план выполнения и как его найти в PostgreSQL

Добавил Sergey Moiseenko on Среда, 6 марта. 2024

Пересказ статьи Henrietta Dombrovskaya. What Is an Execution Plan and How to Find It in PostgreSQL

В последнем блоге (Когда настройка параметра в PostgreSQL не помогает) мы сравнили несколько планов выполнения для оператора SQL по мере изменения параметров и индексов. При этом не было упомянуто то, что собой представляет план выполнения, как можно получить план выполнения запроса и как интерпретировать результат. В этом блоге мы глубже погрузимся в эту тему.
Продолжить чтение "Что такое план выполнения и как его найти в PostgreSQL"