Как найти и удалить дубликаты в Google Sheets

Электронные таблицы — отличный инструмент для организации, анализа и хранения данных в табличной форме. Компании используют электронные таблицы для принятия важных решений и планирования на будущее путем анализа данных. Если вы аналитик данных или кто-то, кто имеет дело с данными на регулярной основе, вы должны знать, что обязательно будут повторяющиеся записи. Они могут быть вызваны человеческими или компьютерными ошибками.

Работа с повторяющимися данными требует дополнительных усилий и времени. Поэтому, если вы хотите найти и удалить повторяющиеся записи в Google Таблицах, не ищите дальше, так как эта статья ответит на все ваши вопросы.

Рекомендуется: Как импортировать CSV в Google Таблицы

Удалить дубликаты в Google Sheets

Google Таблицы предоставляют вам несколько методов для работы с дубликатами. Мы разделили эти методы на 2 категории. Первая категория касается методов, которые позволят вам вручную находить и удалять дубликаты. В то время как другой покажет вам, как автоматически удалять повторяющиеся записи.

Найти и удалить повторяющиеся записи вручную

Используя этот метод, вы можете выделить каждую из повторяющихся записей, а затем вручную удалить их. Здесь мы собираемся показать вам два способа сделать это.

1. Использование условного форматирования

1. Идти к Таблицы Google и откройте документ, который вы хотите отредактировать.

2. После того, как документ открыт. Выберите все данные, которые вы хотите отредактировать, нажав на одну запись, а затем нажмите ctrl + A выбрать все. Теперь иди к Формат>Условное форматирование на панели инструментов вверху.Условное форматирование в Google Sheets

3. После этого в правой части экрана откроется новое окно, как показано на скриншоте ниже. Здесь перейти к Отформатировать ячейки, если и щелкните раскрывающееся меню.форматировать ячейку, если

Примечание: Диапазон будет автоматически заполнен Применить к диапазону поле, так что вам не следует беспокоиться об этом. Тем не менее, вы можете изменить или ввести его вручную отсюда, если это необходимо.

4. В раскрывающемся меню выберите Пользовательская формула есть. Чтобы применить пользовательскую формулу, поскольку в Google Таблицах нет встроенных формул для выделения дубликатов.пользовательская формула

5. После этого введите следующую формулу под Пользовательская формула вариант  =СЧЁТЕСЛИ($A$1:$A1,$A1)>1 Найти дубликаты в Google Sheets - формула countif

Примечание: Функция Countif подсчитывает, сколько раз записи дублируются в данных, а затем выделяет их.

6. Теперь вы можете изменить цвет и шрифт выделенных записей, если хотите под Стиль форматирования или вы можете оставить их по умолчанию, а затем нажать Готово.стиль форматирования

7. Теперь вы увидите, что будут выделены только повторяющиеся записи.выделить повторяющиеся строки в Google Sheets

8. Как только повторяющиеся строки будут выделены, вы можете легко удалить их. Для этого щелкните правой кнопкой мыши на выделенной строке и Удалить строку опцию.опция удаления строк

9. Вы можете сделать это для всех выделенных дубликатов, и в итоге вы получите данные только с уникальными записями.Дедупликация данных

Используя указанную выше опцию, вы можете легко удалить повторяющиеся записи в Google Таблицах.

2. Использование надстройки «Удалить дубликаты»

В соответствии с этим методом вам нужно будет загрузить расширение Chrome для таблиц Google. Шаги для использования этого дополнения следующие:

1. Во-первых, нажмите Дополнения на панели инструментов вверху и выберите Получить дополнения.Получить надстройки для Google Таблиц

2. Теперь найдите Удалить дубликаты в строке поиска и нажмите ввод. Когда появится результат, нажмите + Бесплатно Кнопка для бесплатной установки дополнения. При появлении запроса выберите нужную учетную запись Google и разрешите надстройке доступ к вашей учетной записи.Поиск и установка

3. После этого снова заходим в Дополнения. На этот раз выберите Удалить документы > Найти повторяющиеся или уникальные строки.Удалить дубликаты в Google Sheets

4. Теперь откроется вкладка с запросом Выберите свой лист и диапазон. Вы можете напрямую нажать на Далее так как диапазон будет выбран автоматически.Выбрать диапазон

5. После этого откроется вторая вкладка. При этом вам будет предложено выбрать тип данных, которые вы хотите найти; Дублировать or Уникальное Произведение. Нажмите на Дубликаты так как вы хотите, чтобы повторяющиеся записи были выделены, и нажмите на Далее.

Дубликат или уникальный

Примечание: Если вы хотите, чтобы ваши оригинальные и повторяющиеся записи были выделены, вы можете использовать Дубликаты + 1-е появление опцию.

6. На третьей вкладке можно просто нажать Далее. А на четвертой и последней вкладке вас спросят, что делать с найденными данными. Вы можете выбрать любые параметры на вкладке, если хотите, и нажать на Завершить.окончание

Примечание: Вы также можете выбрать последний вариант — Удалить строки в выделении автоматически удалять дубликаты из данных, не выделяя их.

7. Теперь подождите несколько секунд, пока дубликаты не будут выделены. И после этого вы можете вручную удалить их, если хотите.выделить повторяющиеся данные

Примечание: Выделение дубликатов и удаление вручную в длинном наборе данных может быть утомительным процессом. Поэтому вы должны использовать эти методы только для небольших наборов данных или когда вы просто хотите проверить, есть ли дубликаты в вашем наборе данных или нет. В других случаях мы рекомендуем вам использовать следующие методы.

Как автоматически удалять повторяющиеся записи в Google Sheets

Если вы имеете дело с большим набором данных, вы можете использовать любой из этих методов.

1. Использование уникальной формулы

В этом методе мы собираемся использовать формулу для удаления дубликатов из наших данных. Формула, которую мы собираемся использовать, = уникальный (диапазон) в котором Диапазон это диапазон набора данных. Шаги использования формулы следующие:

важно: Эта формула не сможет работать с данными, чувствительными к регистру. Однако вы можете изменить данные на нижний или верхний регистр в Google Sheets перед применением этой формулы.

1. Перейдите в Google Таблицы и откройте свой документ.

2. После того, как вы откроете документ, выберите пустую ячейку, в которой вы хотели бы увидеть результаты. Как и в моем случае, я выбрал ячейку D1, чтобы показать результат. Теперь введите =Уникальный( в этой камере.Уникальная формула

3. Теперь вы можете ввести диапазон вручную или выбрать все данные для автоматического заполнения диапазона в формуле.Выберите диапазон

4. После заполнения диапазона закройте скобку и нажмите Enter.закрыть скобку

5. Как только вы нажмете Enter, вы увидите новый набор данных со всеми дубликатами, удаленными автоматически.Дедупликация данных

2. Использование удаления повторяющихся настроек

1. Перейдите к своим электронным таблицам и выберите все свои данные.

2. После того, как ваши данные выбраны, перейдите к Данные на панели инструментов и выберите Удалить дубликаты из меню настроек.Удалить дубликаты в Google Sheets

3. Теперь откроется новое окно. Здесь выберите нужные столбцы и нажмите на Удалить дубликаты.удалять дубликаты

4. После этого он покажет вам количество дубликатов, которые были найдены и удалены из ваших данных. Вы можете просто нажать на Хорошо.ok

При этом вы увидите новый уникальный набор данных, в котором нет повторяющихся записей.Уникальные данные

3. Использование инструмента «Редактор сценариев»

В этом методе мы будем использовать Инструмент редактора скриптов в Google Таблицах для создания веб-приложения для автоматического удаления дубликатов. Этот метод в основном предназначен для программистов, но вы все равно можете использовать его, если нет, поскольку код для создания приложения доступен на сайте разработчиков Google. Вы можете просто скопировать и вставить этот код в сценарий, чтобы приложение удаляло дубликаты в Таблицах.

1. Откройте электронную таблицу в Google Таблицах. Нажмите на Инструменты и выберите Редактор скриптов.Редактор скриптов в Google Sheets

2. Редактор сценариев откроется в новой вкладке. Теперь, прежде чем писать какой-либо код в редакторе скриптов, лучше дать ему имя. И для этого нажмите на Проект без названия и изменить имя. Далее нажмите на OK.Изменить имя в редакторе

3. После этого вы можете скопировать и вставить код, чтобы удалить повторяющиеся строки в электронной таблице, доступной на Скрипт Google Apps.

Скрипт удаления повторяющихся строк

4. Когда код будет готов, нажмите БЕГ как показано на скриншоте ниже.Запустить скрипт

5. После этого редактор спросит у вас разрешения. Чтобы дать разрешение, нажмите на Просмотр разрешений. Кроме того, он может попросить вас войти в систему, если вы еще не вошли в свою учетную запись Gmail.просмотр разрешений

6. Подождите несколько секунд, пока приложение удалит повторяющиеся записи. Теперь откройте вкладку, в которой запущены Google Таблицы. Здесь вы обнаружите, что все повторяющиеся записи удалены и остались только уникальные записи.Дубликаты удалены

Заключение

Эти методы прекрасно работают для удаления дубликатов в Google Таблицах. И вы можете использовать любой из перечисленных выше методов для дедупликации ваших данных в электронной таблице. Однако мы рекомендуем вам сделать копию ваших исходных данных, прежде чем применять эти методы только для дальнейшего использования. Кроме того, если у вас возникли проблемы при применении этих методов, вы можете обратиться к нам за помощью в разделе комментариев ниже.