29.05.2025

7 мин

Как удалить лишние пробелы в строке Python

Содержание

Функция strip() и её варианты
Удаление всех пробелов из строки
Удаление повторяющихся пробелов
Практический пример: Очистка данных из файла
Сравнение методов удаления пробелов
Продвинутые техники: Нормализация пробелов
Производительность: выбираем оптимальный метод
FAQ: Часто задаваемые вопросы
Заключение

Функция strip() и её варианты

Python предоставляет несколько встроенных методов для работы с пробелами в строках. Самые базовые из них — это strip(), lstrip() и rstrip(). Научиться работать с остальными методами можно на курсах по Python-разработке.

Метод strip()

Метод strip() удаляет пробелы (и другие указанные символы) с обоих концов строки:

text = » Hello, World! «

cleaned_text = text.strip()

print(cleaned_text) # Выведет: «Hello, World!»

Методы lstrip() и rstrip()

Если вам нужно удалить пробелы только с левой или правой стороны строки, используйте lstrip() и rstrip() соответственно:

text = » Hello, World! «

left_cleaned = text.lstrip() # Удаляет пробелы слева

right_cleaned = text.rstrip() # Удаляет пробелы справа

print(left_cleaned) # Выведет: «Hello, World! «

print(right_cleaned) # Выведет: » Hello, World!»

Удаление всех пробелов из строки

Для полного удаления всех пробелов можно использовать метод replace(), который заменяет указанную подстроку на другую:

text = «Hello, World! How are you?»

no_spaces = text.replace(» «, «»)

print(no_spaces) # Выведет: «Hello,World!Howareyou?»

Удаление повторяющихся пробелов

Часто требуется сохранить одиночные пробелы между словами, но избавиться от повторяющихся. Для этого есть несколько подходов.

Подход №1: Метод split() и join()

Этот подход является наиболее читаемым и интуитивно понятным:

text = «Hello, World! How are you?»

words = text.split() # Разбивает строку по пробелам

cleaned_text = » «.join(words) # Соединяет слова с одиночными пробелами

print(cleaned_text) # Выведет: «Hello, World! How are you?»

Метод split() без аргументов разбивает строку по любому количеству пробельных символов (пробелы, табуляции, переносы строк), что делает его идеальным для этой задачи.

Подход №2: Использование регулярных выражений

Для более сложных случаев удобно использовать регулярные выражения:

import re

text = «Hello, World! How are you?»

cleaned_text = re.sub(r’\s+’, ‘ ‘, text)

print(cleaned_text) # Выведет: «Hello, World! How are you?»

Выражение \s+ соответствует одному или более пробельным символам и заменяет их на один пробел.

Практический пример: Очистка данных из файла

Представим, что у нас есть CSV-файл с данными, где пробелы могут испортить анализ:

# data.csv

Name, Age, City

John, 25 , New York

Mary,35, Chicago

Bob, 42,Los Angeles

Вот как мы можем очистить эти данные:

import csv

cleaned_data = []

with open(‘data.csv’, ‘r’) as file:

reader = csv.reader(file)

for row in reader:

# Очищаем каждое значение от лишних пробелов

cleaned_row = [item.strip() for item in row]

cleaned_data.append(cleaned_row)

# Вывод очищенных данных

for row in cleaned_data:

print(row)

Результат будет следующим:

[‘Name’, ‘Age’, ‘City’]

[‘John’, ’25’, ‘New York’]

[‘Mary’, ’35’, ‘Chicago’]

[‘Bob’, ’42’, ‘Los Angeles’]

Сравнение зарплат по уровням

Junior

70,000 ₽

Middle

150,000 ₽

Senior

250,000 ₽

Сравнение методов удаления пробелов

Давайте сравним различные методы по эффективности и применимости:

Метод	Быстродействие	Читаемость кода	Функциональность	Случаи использования
strip()	Очень высокое	Отличная	Базовая	Удаление пробелов по краям
replace()	Высокое	Хорошая	Средняя	Удаление всех пробелов
split() + join()	Среднее	Отличная	Хорошая	Удаление повторяющихся пробелов
Регулярные выражения	Низкое	Средняя	Расширенная	Сложные шаблоны пробелов
string.translate()	Очень высокое	Низкая	Специализированная	Оптимизированные замены символов

Продвинутые техники: Нормализация пробелов

Иногда требуется более тонкая настройка обработки пробелов, особенно при работе с текстами разных форматов и кодировок.

Обработка Unicode-пробелов

В Unicode существует несколько типов пробелов, которые могут быть незаметны при просмотре, но могут вызвать проблемы при обработке:

import unicodedata

def normalize_spaces(text):

# Нормализация Unicode-символов

normalized = unicodedata.normalize(‘NFKC’, text)

# Удаление повторяющихся пробелов

import re

return re.sub(r’\s+’, ‘ ‘, normalized).strip()

text = «Пример текста с разными\u00A0типами\u2003пробелов»

cleaned = normalize_spaces(text)

print(cleaned) # «Пример текста с разными типами пробелов»

Эта функция сначала нормализует все Unicode-символы, включая различные типы пробелов, а затем применяет регулярное выражение для устранения повторений.

Производительность: выбираем оптимальный метод

Для небольших строк разница в производительности между методами несущественна. Однако при обработке больших текстов или при частом выполнении операций важно выбрать оптимальный метод.

import timeit

text = » » * 1000 + «Hello, World!» + » » * 1000

# Измерение времени выполнения strip()

strip_time = timeit.timeit(lambda: text.strip(), number=100000)

# Измерение времени выполнения регулярных выражений

import re

regex_time = timeit.timeit(lambda: re.sub(r’^\s+|\s+$’, », text), number=100000)

print(f»strip(): {strip_time:.6f} сек»)

print(f»re.sub(): {regex_time:.6f} сек»)

Результаты такого теста показывают, что встроенные методы Python обычно работают быстрее, чем регулярные выражения. Поэтому рекомендуется использовать встроенные методы, когда это возможно.

FAQ: Часто задаваемые вопросы

Как удалить только пробелы в начале строки?

Для удаления пробелов только в начале строки используйте метод lstrip():

text = » Hello, World!»

result = text.lstrip()

print(result) # «Hello, World!»

Как заменить повторяющиеся пробелы одним пробелом?

Лучший способ — использовать регулярные выражения или подход split-join:

import re

text = «Hello world ! «

# Метод 1: регулярные выражения

result1 = re.sub(r’\s+’, ‘ ‘, text)

# Метод 2: split-join

result2 = » «.join(text.split())

# Оба метода вернут «Hello world !»

Как обработать большой файл с пробелами эффективно?

При обработке больших файлов лучше использовать построчное чтение и обработку:

with open(‘input.txt’, ‘r’) as infile, open(‘output.txt’, ‘w’) as outfile:

for line in infile:

cleaned_line = ‘ ‘.join(line.split())

outfile.write(cleaned_line + ‘\n’)

Заключение

Удаление лишних пробелов — одна из базовых операций при обработке текстовых данных в Python. Мы рассмотрели различные методы, начиная от простых, таких как strip(), до более сложных с использованием регулярных выражений.

Чек-лист для работы с пробелами в строках

✅ Используйте strip(), lstrip() или rstrip() для удаления пробелов по краям строки
✅ Применяйте split() + join() для нормализации пробелов внутри строки
✅ Для сложных шаблонов используйте регулярные выражения с re.sub()
✅ Учитывайте производительность при выборе метода для больших объемов данных
✅ Не забывайте о Unicode-пробелах при обработке интернациональных текстов

Умение эффективно обрабатывать пробелы в строках — важный навык для любого Python-разработчика. С ростом объемов обрабатываемых данных и необходимостью их очистки перед анализом, методы, описанные в этой статье, становятся все более востребованными в современной разработке.

А какой метод удаления пробелов вы используете чаще всего в своих проектах?

Оцените статью

★ ★ ★ ★ ★

4.9 (152 оценки)

Хочу стать Python-разработчиком!

Специально для вас мы собрали отдельную подборку лучших онлайн-курсов по Python на рынке и сравнили их по цене, продолжительности и отзывам студентов.

Курсы по Python

Над статьей работали

Автор

Команда tutortop

Маркетплейс онлайн-курсов: команда экспертов в области онлайн образования.

Проверяющий эксперт

Егор Худяков

Проработал проджектом и тимлидом в маркетинговых исследованиях 3 года. Занимался внешней аналитикой в ВСК (страховое агентство). Сейчас работает в «Точке», в команде, которая отвечает за анализ коммуникаций с клиентами.

Источник

Википедия

Ещё по теме

21 апр 2026

1580

Confluence — это современное решение для управления знаниями и совместной работы команд

Что такое Atlassian Confluence Confluence — это корпоративная wiki-платформа и система управления контентом, разработанная австралийской компанией Atlassian в 2004 году. По своей сути это цифровое рабочее пространство, где команды могут создава...

20 апр 2026

4255

Полное руководство по CMD командам Windows: от базовых операций до профессиональной автоматизации

Способы запуска командной строки Windows Перед тем как погружаться в океан команд, необходимо научиться правильно запускать саму командную строку. Существует множество способов, и каждый имеет свои преимущества в зависимости от контекста исполь...

02 апр 2026

1522

Prometheus: Исчерпывающее руководство по системе мониторинга для современной инфраструктуры

Что такое Prometheus? Prometheus — это open-source система мониторинга и оповещения, специально разработанная для работы в динамичных облачных средах. В отличие от традиционных решений, она построена на модели сбора метрик по запросу (pull mode...

02 апр 2026

1481

Деплой: Путеводитель по развертыванию приложений от теории к практике

Что такое деплой и почему он важен Деплой (от английского deploy — развертывать, размещать) представляет собой комплекс действий по переносу программного кода из среды разработки в рабочую среду, где приложение становится доступным конечным пол...

06 мар 2026

2597

Срезы в Python: практическое руководство по эффективной работе с данными

Что такое срезы и синтаксис работы с ними Срез (slice) в Python — это механизм извлечения части последовательности: списка, строки, кортежа или любого другого итерируемого объекта. В отличие от обращения к одному элементу по индексу, срез позво...

06 мар 2026

1571

Java Development Kit: Полное руководство по выбору и использованию JDK для разработчиков

Что такое Java Development Kit и почему он критически важен Java Development Kit (JDK) — это комплексный набор инструментов для разработки приложений на языке программирования Java. JDK включает в себя компилятор javac, среду выполнения JRE (Ja...