Скопировать уникальные из 2х колонок

Interpreter · 20 июл 2019

Здравствуйте.
Прошу помочь. Требуется скопировать одну таблицу, состоящую из 2х полей в другую таблицу из 2х полей, учитывая, что копировать нужно только уникальные записи, а критерий уникальности таков:
1)Миша-Женя не уникальный（т.к. есть Женя-Миша（см. ниже））
2)Женя-Миша （не уникальный, т.к. есть Миша-Женя （см. выше））
3)Миша-Миша （и любые другие дубли） тоже должно быть удалено
Как это сделать многоходовкой с помощью промежуточной（ных）таблиц（ы）я примерно понимаю, но может, есть изящный подход буквально в несколько команд （я не очень разбираюсь: не программист）. Особенно буду признателен, если в качестве факторов будет учтено, что кол-во строк около 50 000 000, а хостинг бесплатный （соответственно, время выполнения команд, вероятно, ограничено）.
Заранее благодарю!

Valick · 20 июл 2019

На заре на столе
Разноцветны стёклышки
Разноцветны тряпочки-
Непонятно ни хрена

Interpreter · 20 июл 2019

А рубаи прикольные )) Вроде пояснил как мог. Если вкратце, то надо очистить таблицу, состоящую из 2 полей от записей:
1 2 （т.к. это обратный дубль к следующей записи）
2 1 （т.к. это обратный дубль к предыдущей записи）
1 1 （в обоих полях одинаковые значения）
2 2 （в обоих полях одинаковые значения）

Valick · 20 июл 2019

http://www.gr-oborona.ru/texts/1056897754.html
легче не стало, покажите хотя бы структуру таблицы

Interpreter · 20 июл 2019

id int(11) auto_increment
number1 varchar(20)
number2 varchar(20)

artoodetoo · 21 июл 2019

Я правильно понимаю, если есть "повторы", то надо удалить все такие записи, не оставляя уникальной?

Было
1,2
2,1
4,5
Стало
4,5

Какая-то ерунда, по-моему
--- Добавлено ---
Это похоже на неправильную интерпретацию тестового задания с собеседования.
--- Добавлено ---
Ну если это таки правильная постановка, то можно сделать так:

Код (SQL):

SELECT least(x,y), greatest(x,y)

FROM ttt

WHERE x<>y

GROUP BY 1,2

HAVING COUNT(*)=1

--- Добавлено ---
А чтобы скопировать в новую таблицу, надо использовать insert...select

Interpreter · 21 июл 2019

Нет, не так. Простите, действительно это я так описал. Надо так:
Было
1,1
1,2
2,1
4,5
Стало
1,2
4,5
и там будут не цифры, а текст (что-то типа 7L0129620), название таблицы cross

artoodetoo · 21 июл 2019

Для SQL без разницы что группировать: цифры или что-то другое.
Если надо таки оставить уникальные значения, то уберите фразу having из моего запроса.
Как вариант, можно переделать с группировки на distinct. Суть та же, но немного короче.

Select distinct least(x,y), greatest(x,y)
From ttt
Where x<>y

Interpreter · 21 июл 2019

Спасибо большое, работают оба варианта!
Только вот мне надо выходные данные либо в новую таблицу залить либо эту же таблицу заменить выходными данными. Пробую залить в новую вот так:

Код (Text):

INSERT INTO 'cross' SELECT distinct least(number1,number2), greatest(number1,number2) FROM `temp` WHERE number1<>number2

но не работает Подскажите, пожалуйста, решение.

Valick · 21 июл 2019

@Interpreter, достаточно сходить в мануал и почитать какие условия нужны для insert ... select.
Названия полей принимающей таблицы должны совпадать с названиями полей таблицы выборки. Для этого надо сделать alias для least и greatest. Погугли, что такое AS в MySQL.

Interpreter · 21 июл 2019

Погуглил... про AS отдельно написано, про least и greatest - написано, а вот про их связку особо ничего. Только на одном каком-то сайте нашел нечто похожее, в результате чего составил какую-то вот такую "дичь":

Код (Text):

INSERT INTO 'cross' ('number1', 'number2')

SELECT distinct least(number1,number2) AS least_value

greatest(number1,number2) AS greatest_value

FROM `temp` WHERE number1<>number2

которая все равно не работает. Прошу помощи.

Valick · 21 июл 2019

В таблице cross какие поля?
P.S. сорь не то подсказываю, вечером продолжим.

Interpreter · 21 июл 2019

В таблице cross поля: id int(11) auto_increment | number1 varchar(20) | number2 varchar(20)
В таблице temp поля: number1 varchar(20) | number2 varchar(20)

Interpreter · 21 июл 2019

Все получилось:

Код (Text):

INSERT INTO `cross` (`number1`, `number2`)

SELECT distinct least(`number1`, `number2`),

greatest(`number1`, `number2`)

FROM `temp` WHERE number1<>number2

Спасибо огромное всем за помощь!

artoodetoo · 22 июл 2019

Для спасибо есть кнопка с большим пальцем вверх - мы здесь за лайки работаем

Скопировать уникальные из 2х колонок

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

artoodetoo Суперстар
Команда форума Модератор

Interpreter Активный пользователь

artoodetoo Суперстар
Команда форума Модератор

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

Interpreter Активный пользователь

artoodetoo Суперстар
Команда форума Модератор

Быстрый поиск

Скопировать уникальные из 2х колонок

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

artoodetoo Суперстар Команда форума Модератор

Interpreter Активный пользователь

artoodetoo Суперстар Команда форума Модератор

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

Valick Активный пользователь

Interpreter Активный пользователь

Interpreter Активный пользователь

artoodetoo Суперстар Команда форума Модератор

artoodetoo Суперстар
Команда форума Модератор

artoodetoo Суперстар
Команда форума Модератор

artoodetoo Суперстар
Команда форума Модератор