postgresql выборка 100 случайных строк

Question

postgresql выборка 100 случайных строк

Следующий запрос занимает около 300-400 МС на postgresql 9.1.
Таблица содержит ~2М строк.
Оправдано ли такое исполнение? Можно ли его улучшить?

SELECT "Products"."Id"

      , "Products"."Title"

      , "Products"."ThumbHeight"

      , "Products"."LargeImageWidth"

      , "Products"."LargeImageHeight"

      , "Products"."Url"

      , "Products"."BrowseNodeId"

FROM "Products"

WHERE  "Products"."Id" = ANY(ARRAY(SELECT (random()*2233071)::int

                FROM generate_series(1, 100)));

И вот план объяснения:

--------------------------------------------------------------------------------

 Bitmap Heap Scan on "Products"  (cost=60.48..100.46 rows=10 width=268)

   Recheck Cond: ("Id" = ANY ($0))

   InitPlan 1 (returns $0)

     ->  Function Scan on generate_series  (cost=0.00..17.50 rows=1000 width=0)

   ->  Bitmap Index Scan on "Products_pkey"  (cost=0.00..42.97 rows=10 width=0)

     Index Cond: ("Id" = ANY ($0))

Объясните анализ:

Bitmap Heap Scan on "Products"  (cost=60.48..100.46 rows=10 width=268) (actual time=77.702..80.944 rows=100 loops=1)

   Recheck Cond: ("Id" = ANY ($0))

   InitPlan 1 (returns $0)

     ->  Function Scan on generate_series  (cost=0.00..17.50 rows=1000 width=0) (actual time=0.097..0.348 rows=100 loops=1)

   ->  Bitmap Index Scan on "Products_pkey"  (cost=0.00..42.97 rows=10 width=0) (actual time=77.601..77.601 rows=104 loops=1)

         Index Cond: ("Id" = ANY ($0))

 Total runtime: 81.409 ms

Id-это первичный ключ.:
"Products_pkey" PRIMARY KEY, btree ("Id")

Спасибо!

700 2

performance postgresql-9.1 random

2 ответов:

Comments

Ничего не найдено.

Mithrandir · Accepted Answer · 2012-05-30 17:48:28

Попробуйте сделать это в сравнении с вашим запросом:

SELECT "Products"."Id"
      , "Products"."Title"
      , "Products"."ThumbHeight"
      , "Products"."LargeImageWidth"
      , "Products"."LargeImageHeight"
      , "Products"."Url"
      , "Products"."BrowseNodeId"
FROM "Products"
ORDER BY random()
LIMIT 100

michaelr524 · Accepted Answer · 2012-06-01 10:50:42

Вот решение, которое хорошо работает для моего случая использования (выберите 100 случайных продуктов для веб-страницы):

дублируйте таблицу

перемешать строки таблицы

добавить столбец автоинкремента

выбрать из случайного диапазона (например, 100-200, 1567000-1567100)

Время запроса сократилось до 2ms .

Вот набор команд, которые я использовал:
create table RandProducts as select * from "Products" order by random();
alter table RandProducts add column RandId serial8;
create index on RandProducts(randid);
И затем, чтобы получить 100 случайных строк, я просто делаю что-то вроде этого:
select * from Products where RandId between 8000 and 8100;