ДД: Как рассчитать оптимальный размер блока? [закрытый]
Как рассчитать оптимальный размер блока при запуске dd? Я исследовал немного, и я не нашел ничего о том, как это будет достигнуто.
у меня сложилось впечатление, что больший размер блока приведет к более быстрому dd... это правда?
Я dd два идентичных 500GB Hitachi HDDs, которые работают на 7200rpm на коробке под управлением Intel Core i3 с 4GB DDR3 1333MHZ RAM, поэтому я пытаюсь выяснить, какой размер блока использовать. (Я собираюсь загружать Ubuntu 10.10 x86 с флэш-накопителя и запускать его с этого.)
6 ответов:
оптимальный размер блока зависит от различных факторов, включая операционную систему (и ее версию), а также различные аппаратные Шины и диски. Несколько Unix-подобных систем (включая Linux и по крайней мере некоторые разновидности BSD) определяют
st_blksizeчленstruct statэто дает то, что ядро считает оптимальным размером блока:#include <sys/stat.h> #include <stdio.h> int main(void) { struct stat stats; if (!stat("/", &stats)) { printf("%u\n", stats.st_blksize); } }лучший способ может быть экспериментировать: скопируйте гигабайт с различными размерами блоков и времени, что. (Не забудьте очистить буфер ядра кэш перед каждым запуском:
echo 3 > /proc/sys/vm/drop_caches).однако, как правило, я обнаружил, что достаточно большой размер блока позволяет
ddсделать хорошую работу, и различия между, скажем, 64 Кб и 1 Мб небольшие, по сравнению с 4 Кб и 64 Кб. (Хотя, по общему признанию, прошло много времени с тех пор, как я это сделал. Я использую mebibyte по умолчанию сейчас, или просто пустьddвыбрать размер.)
как говорили другие, нет универсально правильного размера блока; то, что оптимально для одной ситуации или одной части оборудования, может быть ужасно неэффективным для другого. Кроме того, в зависимости от состояния дисков может быть предпочтительным использовать другой размер блока, чем то, что является "оптимальным".
одна вещь, которая довольно надежна на современном оборудовании, заключается в том, что размер блока по умолчанию 512 байт имеет тенденцию быть почти на порядок медленнее, чем более оптимальная альтернатива. Когда в сомневаюсь, я обнаружил, что 64K-это довольно солидный современный дефолт. Хотя 64K обычно не является оптимальным размером блока, по моему опыту, он имеет тенденцию быть намного более эффективным, чем по умолчанию. 64K также имеет довольно солидную историю надежной работы: вы можете найти сообщение из списка рассылки Eug-Lug, около 2002 года, рекомендуя размер блока 64K здесь:http://www.mail-archive.com/[email protected]/msg12073.html
для определения оптимального размера выходного блока, я написан следующий скрипт, который тестирует запись 128m тестового файла с dd в диапазоне различных размеров блоков, от по умолчанию 512 байт до максимум 64M. будьте осторожны, этот скрипт использует DD внутренне, поэтому используйте с осторожностью.
dd_obs_test.sh:
#!/bin/bash # Since we're dealing with dd, abort if any errors occur set -e TEST_FILE=${1:-dd_obs_testfile} TEST_FILE_EXISTS=0 if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi TEST_FILE_SIZE=134217728 if [ $EUID -ne 0 ]; then echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2 fi # Header PRINTF_FORMAT="%8s : %s\n" printf "$PRINTF_FORMAT" 'block size' 'transfer rate' # Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864 do # Calculate number of segments required to copy COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE)) if [ $COUNT -le 0 ]; then echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests." break fi # Clear kernel cache to ensure more accurate test [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches # Create a test file with the specified block size DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null) # Extract the transfer rate from dd's STDERR output TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?') # Clean up the test file if we created one if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi # Output the result printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE" doneЯ тестировал этот скрипт только на системе Debian (Ubuntu) и на OSX Yosemite, поэтому, вероятно, потребуется некоторая настройка для работы с другими Unix ароматизаторы.
по умолчанию команда создает тестовый файл с именем dd_obs_testfile в текущем каталоге. Кроме того, можно указать путь к пользовательскому тестовому файлу, указав путь после имени сценария:
$ ./dd_obs_test.sh /path/to/disk/test_fileвывод скрипта представляет собой список проверенных размеров блоков и их соответствующую передачу цены вот такие:
$ ./dd_obs_test.sh block size : transfer rate 512 : 11.3 MB/s 1024 : 22.1 MB/s 2048 : 42.3 MB/s 4096 : 75.2 MB/s 8192 : 90.7 MB/s 16384 : 101 MB/s 32768 : 104 MB/s 65536 : 108 MB/s 131072 : 113 MB/s 262144 : 112 MB/s 524288 : 133 MB/s 1048576 : 125 MB/s 2097152 : 113 MB/s 4194304 : 106 MB/s 8388608 : 107 MB/s 16777216 : 110 MB/s 33554432 : 119 MB/s 67108864 : 134 MB/s(Примечание: единица скорости передачи данных зависит от ОС)
для проверки оптимального чтения размер блока, вы можете использовать более или менее тот же процесс, но вместо чтения из /dev/zero и записи на диск, вы бы читали из / dev / zero диск и запись в /dev / null. Сценарий для этого может выглядеть так:
dd_ibs_test.sh:
#!/bin/bash # Since we're dealing with dd, abort if any errors occur set -e TEST_FILE=${1:-dd_ibs_testfile} if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi TEST_FILE_SIZE=134217728 # Exit if file exists if [ -e $TEST_FILE ]; then echo "Test file $TEST_FILE exists, aborting." exit 1 fi TEST_FILE_EXISTS=1 if [ $EUID -ne 0 ]; then echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2 fi # Create test file echo 'Generating test file...' BLOCK_SIZE=65536 COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE)) dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1 # Header PRINTF_FORMAT="%8s : %s\n" printf "$PRINTF_FORMAT" 'block size' 'transfer rate' # Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864 do # Clear kernel cache to ensure more accurate test [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches # Read test file out to /dev/null with specified block size DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null) # Extract transfer rate TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?') printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE" done # Clean up the test file if we created one if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fiважным отличием в этом случае является то, что тестовый файл является файлом, который записывается скриптом. Не указывайте эту команду на существующий файл или существующий файл будет перезаписано нулями!
для моего конкретного оборудования я обнаружил, что 128K был наиболее оптимальным размером входного блока на жестком диске, а 32K был наиболее оптимальным на SSD.
хотя этот ответ охватывает большинство моих выводов, я сталкивался с этой ситуацией достаточно раз, что я написал об этом в блоге:http://blog.tdg5.com/tuning-dd-block-size/ вы можете найти более подробную информацию о тестах, которые я выполнил там.
Я нашел свой оптимальный размер блока 8 МБ (равный дисковому кэшу?) Мне нужно было вытереть (некоторые говорят: мыть) пустое пространство на диске, прежде чем создавать его сжатый образ. Я использовал:
cd /media/DiskToWash/ dd if=/dev/zero of=zero bs=8M; rm zeroя экспериментировал со значениями от 4K до 100M.
после того, как я позволил dd работать некоторое время, я убил его (Ctlr+C) и прочитал вывод:
36+0 records in 36+0 records out 301989888 bytes (302 MB) copied, 15.8341 s, 19.1 MB/sкак dd отображает скорость ввода/вывода (19,1 МБ / с в этом случае) легко увидеть, если значение, которое вы выбрали выполняет лучше предыдущего или хуже.
мои оценки:
bs= I/O rate --------------- 4K 13.5 MB/s 64K 18.3 MB/s 8M 19.1 MB/s <--- winner! 10M 19.0 MB/s 20M 18.6 MB/s 100M 18.6 MB/s
вы можете попробовать использовать dd-opt, небольшая утилита, которую я написал.
(улучшения/уточнения приветствуются!)
это полностью зависит от системы. Вы должны экспериментировать, чтобы найти оптимальное решение. Попробуйте начать с
bs=8388608. (Поскольку жесткие диски Hitachi, похоже, имеют кэш 8 МБ.)
- для лучшей производительности используйте самый большой размер блока, который вы можете разместить в ОЗУ (будет отправлять меньше вызовов ввода-вывода в ОС)
- для лучшей точности и восстановления данных установите размер блока в собственный размер сектора ввода
поскольку dd копирует данные с опцией conv=noerror, sync, любые ошибки, с которыми он сталкивается, приведут к тому, что оставшаяся часть блока будет заменена нулевыми байтами. Большие размеры блоков будут копироваться быстрее, но каждый раз возникает ошибка обнаруженный остаток блока игнорируется.
Comments