Пробные партии чипов NAND Flash-памяти объёмом 128 Гбит были произведены на IMFT, совместном предприятии Intel и Micron, еще в 2011 году. До стадии массового производства они добрались лишь недавно, а вот и самый первый коммерческий SSD, в котором применяются 128-гигабитные NAND-устройства, — Crucial M500. Образец, попавший на тестирование в лабораторию 3DNews, является наиболее вместительной моделью из всей линейки M500 — 960 Гбайт. И тот факт, что мы выбрали именно терабайтную разновидность, в данном случае совершенно не случаен. Ведь главная причина перехода на чипы удвоенной емкости — удешевление производства, что наконец опустит розничные цены SSD большого объема с небес на землю.
⇡#NAND-устройства объемом 128 Гбит
Изготовление одного чипа Flash-памяти объемом 128 Гбит действительно обходится дешевле, чем двух отдельных кристаллов по 64 Гбит каждый, которые используются во всех выпущенных ранее SSD с памятью, произведённой по норме 19 (Toshiba, Samsung) или 20 нм (Intel, Micron). На первый взгляд, нет никакой разницы между массивом ячеек, сосредоточенным на едином полупроводниковом кристалле, и массивом, физически разделенным на два чипа, однако 128-гигабитные NAND-устройства IMFT имеют существенные архитектурные отличия. Основное — это увеличенный в очередной раз размер страницы (минимального массива ячеек, в который может быть записана информация и из которого она может быть считана), с 8 до 16 Кбайт, и размер блока (минимального массива ячеек, который может быть очищен, — не путать с логическими блоками, которыми оперирует хост-контроллер) — с 256 до 512 страниц.
Укрупнение архитектурных элементов позволило выбросить из чипа логику, контролирующую упраздненные страницы и блоки. В результате плотность записи данных возросла с 0,542 до 0,634 Гбит/мм2, а это ни много ни мало 17%. Значит, из одной полупроводниковой пластины можно изготовить больше микросхем памяти.
Характеристики MLC Flash-памяти производства IMFT | |||||
---|---|---|---|---|---|
Техпроцесс, нм | 50 | 34 | 25 | 20 | 20 |
Емкость NAND-устройства, Гбит | 16 | 32 | 64 | 64 | 128 |
Размер страницы, Кбайт | 4 | 4 | 8 | 8 | 16 |
Размер блока, страниц | 128 | 128 | 256 | 256 | 512 |
Макс. время чтения страницы, мкс | НД | НД | 75 | 100 | 115 |
Макс. время записи страницы, мкс | 900 | 1200 | 1300 | 1300 | 1600 |
Типичное время очистки блока, мс | НД | НД | 3 | 3 | 3 |
Площадь кристалла, мм2 | НД | 172 | 167 | 118 | 202 |
Плотность записи, Гбит/мм2 | НД | 0,186 | 0,383 | 0,542 | 0,634 |
Допустимое число циклов перезаписи | 10 000 | 5 000 | 3 000 | 3 000 | 3 000 |
Реорганизация архитектуры также повлияла на различные аспекты производительности NAND-устройства. «Разбухание» страницы с 8 до 16 Кбайт увеличивает время выполнения операций чтения и записи ее содержимого с 100/1300 до 115/1600 мкс соответственно. Впрочем, поскольку увеличение латентности далеко от двукратного, скорость чтения/записи логических блоков, равных или превышающих по размеру 16 Кбайт, только увеличивается. А вот мелкие — по 8 Кбайт и меньше — будут укладываться в страницы с меньшей скоростью и считываться оттуда также более медленно.
Кроме того, для записи логического блока, уступающего по размеру странице, контроллер вынужден «портить» целых 16 Кбайт, что быстро сокращает объем свободных страниц при активной записи по произвольным адресам. Ну а в том случае, когда механизм «сбора мусора» (Garbage Collection) контроллера не успевает подготовить новые чистые страницы, возникает известная проблема накопителей на основе Flash-памяти — для выполнения каждой новой записи требуется процедура read-modify-write. Последовательность действий такова: необходимо скопировать содержимое всего блока в кеш-память, внести в него изменения, попутно обнулив ячейки, и наконец записать данные обратно. Очевидно, что в результате увеличения размера страницы сама процедура read-modify-write стала занимать еще больше времени, чем в случае с чипами объемом 64 Гбит, произведенными по той же норме 20 нм.
Для интереса рассчитаем приблизительную длительность всех шагов read-modify-write при пессимистичном сценарии — внесении изменений в произвольное количество страниц блока, который целиком занят полезными данными:
В результате даже без учета затрат на изменение данных в кеше и любых промежуточных этапов между непосредственными операциями считывания/программирования, при возникновении процедуры read-modify-write контроллер SSD получает чувствительный штраф на 881 880 мкс, или 0,88188 с! NAND-устройство с архитектурой 64-гигабитных чипов для такой же процедуры требует 361 400 мкс, но почти целая секунда — это уже вечность в масштабах современных полупроводниковых схем.
Также не будем забывать, что даже в той ситуации, когда нагрузка не столь интенсивна, а процент свободного объема на SSD достаточно велик, чтобы процедура read-modify-write редко вставала на пути быстрой отработки команд хост-контроллера, механизм «уборки мусора» все равно сталкивается с ней, выполняя фоновую дефрагментацию массива и подготовку пустых страниц.
Нельзя обойти вниманием и тот факт, что попутно с увеличением латентности при выполнении read-modify-write многократно возрастает и Write Amplification — разница между объемом данных, отправленных на SSD хост-котроллером, и тем объемом, который непосредственно записывается в ячейки Flash-памяти. К примеру, при необходимости записать 4 Кбайт данных в вышеописанной ситуации на микросхеме объемом 64 Гбит перезаписывается блок, содержащий 1024 Кбайт, а на 128-гигабитном чипе — уже 8192 Кбайт. В том и другом случае имеет место Write Amplification со множителем, соответственно, 256 и 2048. Конечно, приятно, что IMFT нашла возможность повысить плотность записи Flash-памяти, оставаясь в рамках текущего техпроцесса 20 нм, — это на некоторое время откладывает снижение ресурса службы ячеек, ожидаемое в связи с грядущим переходом на норму 16 нм (заявленное количество циклов перезаписи для 128-гигабитных чипов такое же, как и для чипов по 64 Гбит, — 3000). Но модифицированная архитектура располагает к тому, что исчерпываться оно будет более активно.
Подведем промежуточный итог. Чипы MLC Flash-памяти объемом 128 Гбит в силу одних лишь архитектурных изменений отличаются от своих 64-гигабитных аналогов, произведенных по тому же техпроцессу 20 нм, а) более низкой себестоимостью, б) увеличенной производительностью при чтении/записи логических блоков размером 16 Кбайт и выше, в) повышенной латентностью при чтении/записи более мелких блоков. Кроме того, радикально более затратная отработка операций read-modify-write выдвигает особые требования к производительности контроллера SSD, выполняющего сбор мусора. Ну и чуть-чуть беспокоит ситуация с потенциально более интенсивным износом ячеек.
⇡#Чередование: беда SSD малого объема
Напомним об одном приеме, за счет которого производители повышают пропускную способность твердотельных накопителей. В большинстве современных SSD форм-фактора 2,5 дюйма к каждому каналу контроллера (а их у всех популярных контроллеров по восемь), подключено по несколько NAND-устройств в режиме чередования. Понятие «чередование» (interleaving) должно быть знакомо читателям, заставшим компьютеры эпохи SDRAM, где оно употреблялось в отношении оперативной памяти. В случае с SSD принцип чередования не изменился: в то время как контроллер ожидает, когда одно NAND-устройство на канале записывает в ячейки уже переданные ему данные, начинается программирование другого устройства.
В протестированных нами твердотельных накопителях объемом 240-256 Гбайт с памятью 19-20 нм, как правило, применяется чередование четырех NAND-устройств на каждом канале, в то время как вдвое менее ёмкие SSD довольствуются чередованием двух NAND-устройств. Как следствие, различается производительность SSD разного объема под одной маркой: вплоть до 30% при последовательной записи. В моделях с «сырым» объемом чипов 512 Гбайт встречается и восемь NAND-устройств на канале, но в такой конфигурации, по-видимому, чередуются уже пары кристаллов, что не дает никакого дальнейшего прироста быстродействия.
Ну а теперь, когда в распоряжении производителей оказалось ядро Flash-памяти объемом 128 Гбит, можно набирать SSD того же объема из вдвое меньшего числа NAND-устройств. Как следствие, минимальная «сырая» емкость массива памяти, при которой устройство достигает пиковой для его архитектуры производительности, изменяется с 256 на 512 Гбайт. А устройства объемом 128 Гбайт перемещаются в нишу аутсайдеров, в которой среди SSD на 64-гигабитных микросхемах пребывают SSD объемом 64 Гбайт. Упс.
Еще одно новшество 128-гигабитных чипов производства IMFT — интерфейс ONFi версии 3.0, который увеличивает скорость передачи данных чипов в одном направлении до 400 Мбайт/с с 200 Мбайт/с, характерных для ONFi 2.0. Впрочем, если судить по спецификациям, пропускная способность Crucial M5 весьма далека от совокупного потенциала восьми каналов с такими NAND-устройствами — даже без учета эффекта чередования. Здесь вступают в силу ограничения производительности контроллера, да и лимит интерфейса SATA 6 Гбит/с уже близок.
Впрочем, у ONFi 3.0 есть и другие достоинства, а именно — пониженное напряжение питания и терминация сигнала на чипе, что позволяет более эффективно расходовать энергию.
⇡#Crucial M500: технические характеристики, цены
Производитель | Crucial | |||
---|---|---|---|---|
Серия | M500 | |||
Модельный номер | CT120M500SSD1 | CT240M500SSD1 | CT480M500SSD1 | CT960M500SSD1 |
Форм-фактор | 2,5 дюйма | |||
Интерфейс | SATA 6 Гбит/с | |||
Емкость, Гбайт | 120 | 240 | 480 | 960 |
Конфигурация | ||||
Микросхемы памяти: тип, интерфейс, техпроцесс, производитель | MLC, ONFI 3.0, 20 нм, Micron | |||
Микросхемы памяти: число / количество NAND-устройств в чипе | 8/1 | 16/1 | 16/2 | 16/4 |
Контроллер | Marvell 88SS9187-BLD2 | |||
Буфер: тип, объем, Мбайт | DDR3 SDRAM 1600МГц, 256 | DDR3 SDRAM 1600МГц, 256 | DDR3 SDRAM 1600МГц, 512 | DDR3 SDRAM 1600МГц, 512 |
Производительность | ||||
Макс. устойчивая скорость последовательного чтения, Мбайт/с | 500 | |||
Макс. устойчивая скорость последовательной записи, Мбайт/с | 130 | 250 | 400 | |
Макс. скорость произвольного чтения (блоки по 4 Кбайт), оп./с | 62 000 | 72 000 | 80 000 | |
Макс. скорость произвольной записи (блоки по 4 Кбайт), оп./с | 35 000 | 60 000 | 80 000 | |
Физические характеристики | ||||
Потребляемая мощность: бездействие/чтение-запись, Вт | ||||
Ударопрочность | НД | |||
MTBF (среднее время наработки на отказ), ч | 1,2 млн | |||
AFR (annualized failure rate), % | НД | |||
Габаритные размеры: ДхВхГ, мм | 100,15x69,85x6,85 | |||
Масса, г | НД | |||
Гарантийный срок, лет | 3 | 3 | 3 | 3 |
Ориентировочная розничная цена, руб. | 4 000 | 6 500 | 12 600 | 20 500 |
В целом профиль производительности всех представителей серии M500 напоминает таковой у прочих SSD на платформе Marvell (к примеру, Plextor M3 Pro или M5 Pro). Именно с Plextor M5 Pro наиболее интересно сравнить новинки, поскольку SSD обеих марок комплектуются одинаковым контроллером Marvell 88SS9187-BLD2, а основное различие заключается в интерфейсе используемой памяти: Toggle-Mode DDR 2.0 в случае Plextor и ONFi 3.0 у Crucial. Оба интерфейса обеспечивают пропускную способность до 400 МБайт/с на чип. Кстати, по-видимому, поддержка ONFi 3.0 — это заслуга разработчиков прошивки M500, ибо в публичной документации на Marvell 88SS9187-BLD2 она не фигурирует.
Iometer 1.1.0 RC1
После каждого теста, включающего запись значительного объема данных, диск очищается с помощью Secure Erase. Длительные тесты на запись разделены на несколько частей, перемежающихся очисткой, чтобы первые пробы теста, заполняющие диск, не влияли на скорость последующих.
Синтетический тест, эмулирующий нагрузку реальных приложений и различные паттерны использования ресурсов ПК. Бенчмарк установлен на основном накопителе стенда. На тестируемом накопителе создается единственный раздел в файловой системе NTFS на весь доступный объем, и в PCMark 7 проводится тест Secondary Storage. В качестве результатов теста учитывается как итоговый балл, так и скорость выполнения отдельных субтестов.
⇡#Зависимость производительности от свободного объема
Чтобы проверить, насколько падает скорость записи на SSD по мере заполнения, мы поэтапно забиваем его случайными данными на блочном уровне и проводим с помощью Iometer тесты произвольной записи блоков по 4 Кбайт с глубиной очереди запросов 4. Затем на диск посылается команда TRIM (при помощи утилиты Diskpart создается и форматируется раздел на весь объем диска) и еще раз измеряется скорость записи.
Для SSD, выполняющих компрессию записываемых данных, тесты скорости записи проводятся как на повторяющихся данных, так и на рандомизированных.
В качестве тестовой платформы используется компьютер с материнской платой MSI 890GXM-G65, процессором AMD Phenom II X2 560 Black Edition и 4 Гбайт RAM DDR3 1600 МГц. Диск подключается к контроллеру, встроенному в чипсет материнской платы, и работает в режиме AHCI. Операционная система — Windows 7 Ultimate X64.
Объем и скорость передачи данных в бенчмарках указываются в бинарных единицах (1 Кбайт = 1024 байт).
Участники тестирования
Последовательное чтение
При размере блока от 16 Кбайт производительность Crucial M500 отстает от показателей большинства соперников, за исключением Vertex 450. Впрочем, при достижении блоком размера 2048 Кбайт скорость резко приближается к пределу, который, по всей видимости, устанавливает интерфейс SATA 6 Гбит/с.
Последовательная запись
С записью у Crucial M500 дела обстоят похуже, чем с чтением. При увеличении размера блока до 16 Кбайт рост его скорости замедляется, и далее она держится на уровне 400 Мбайт/с. Похожую динамику демонстрирует Plextor M5 Pro, а вот группа более успешных соперников легко преодолевает планку 470 Мбайт/с. Гораздо медленнее работают Samsung SSD 840 и Intel SSD 520, нагруженный рандомизированными данными.
Устоявшееся время отклика
Устоявшееся время отклика Crucial M500 находится на уровне большинства его конкурентов, за исключением Intel SSD 520. Ничего необычного в этом тесте мы не нашли.
Произвольное чтение
Скорость чтения на отметке 4 Кбайт у M500 несколько меньше, чем у основной массы конкурентов, хотя разница и не критичная. Но заметьте, что «спуск» графика происходит при размере блока свыше 8 Кбайт, так как именно таков размер страницы в чипах памяти, которые используются здесь. В этом плане M500 оказывает своим соперникам достойное сопротивление.
Произвольная запись
Если судить по левой части графика, у Crucial M500 наблюдается провал производительности при записи блоков меньше 4 Кбайт. Среди прочих SSD такой же особенностью обладает только Intel SSD 520. На отметке 4 Кбайт, которая обычно используется для экспресс-оценки производительности, M500 близок к Plextor M5 Pro: оба имеют не самые высокие результаты.
Чтение при разной длине очереди команд
Скорость M500 становится максимальной уже при трёх командах в очереди.
Запись при разной длине очереди команд
В следующем тесте мы видим, что максимальную скорость Crucial M500 также набирает при четырех командах в очереди — это приемлемый результат для потребительского SSD.
Многопоточное чтение
В тесте на многопоточное чтение мы не встречаем ничего необычного. При увеличении количества потоков скорость Crucial M500 растёт, хотя этот накопитель немного отстаёт от своих соперников на протяжении всего теста.
Многопоточная запись
Скорость нашего главного подопытного достигает максимума уже при двух потоках, но в целом она заметно ниже, чем у большинства других SSD.
В финском бенчмарке PCMark 7 герой нашего обзора заметно проигрывает своим конкурентам, включая Samsung SSD 840. Это не удивительно — если посмотреть результаты наших тестов в Iometer.
Если взглянуть подробнее на диаграммы PCMark, станет понятно, что Crucial M500 отстаёт от своих соперников почти во всех субтестах. Особенно сильно его отставание заметно в тесте, посвящённом запуску приложений. В других субтестах (игры, импорт картинок, обработка видео и Windows Defender) этот накопитель отстаёт от своих конкурентов не очень сильно.
Зависимость производительности от свободного объема
Падение производительности начинается уже на рубеже 512 Гбайт, впрочем, когда на SSD остаётся 128 свободных гигабайт, скорость внезапно восстанавливается. Однако как только пространство сокращается до 64 Гбайт, следует стремительный провал. Похоже, произошло именно то, что мы предсказывали: Crucial M500 сошел с дистанции раньше, чем SSD, оснащенные 64-гигабитными NAND-устройствами, по причине существенно возросшего «штрафа» на процедуру read-modify-write. Впрочем, после получения команды TRIM скорость работы немедленно восстанавливается.
Crucial M500 — интереснейшее устройство во многих отношениях. Главное новшество M500 заключается в применении кристаллов Flash-памяти производства IMFT емкостью 128 Гбайт, что немедленно выливается в существенное практическое преимущество: модификация на 960 Гбайт оказывается намного дешевле, чем большинство других SSD, приблизившихся к емкости 1 Тбайт. Единственным конкурентом M500 в этой ценовой нише является Samsung SSD 840 EVO, себестоимость которого снижена другим путем — за счет применения TLC-микросхем.
По производительности 128-гигабитные NAND-устройства также кое в чем отличаются от чипов емкостью 64 Гбит, которые используются повсеместно в потребительских SSD. Новая архитектура, характеризующаяся увеличенным размером страницы и блока, в сочетании с интерфейсом ONFi 3.0 сулит определенное увеличение линейных скоростей и вместе с тем имеет ряд издержек: сниженную производительность при чтении и записи мелких блоков (меньше 8 Кбайт) и, что более важно, повышенную нагрузку на механизм «сбора мусора» и в какой-то степени более быстрые темпы износа ячеек. При этом заявленный ресурс выносливости чипов по-прежнему составляет 3000 циклов перезаписи.
Однако нельзя сказать, что Crucial M500 в полной мере раскрывает потенциал новых чипов. В бенчмарках новинка рисует примерно такой же график последовательной записи, как и Plextor M5 Pro — накопитель на таком же контроллере Marvell 88SS9187-BLD2. С одной стороны, по этим результатам можно с определенной долей уверенности судить, что интерфейс ONFi 3.0 дает возможность устройствам Micron работать на уровне чипов Toggle-Mode DDR 2.0, которые до сих пор являются приоритетным выбором для производства многих SSD «первой категории».
С другой стороны, напрашивается гипотеза, что именно производительность контроллера ограничивает потенциал массива Flash-памяти обоих устройств, поэтому линейные показатели Crucial M500 по записи относительно невелики по сравнению с достижениями его наиболее успешных конкурентов: Corsair Neutron GTX, Samsung SSD 840 Pro, OCZ Vertex 450. То же самое, хотя и в меньшей степени, касается и последовательного чтения.
По производительности в количестве операций за секунду M500 вполне себе держит марку, за исключением записи блоков малого размера (меньше 4 Кбайт), где у продукта Crucial наблюдается провал, характерный еще разве что для SSD на платформе SandForce.
Впрочем, это резюме относится лишь к модификациям M500 наибольшей емкости — 480 и 960 Гбайт. Модели объемом 120 и 240 Гбайт существенно уступают в скорости записи аналогичным предложениям, использующим привычные NAND-устройства по 64 Гбит производства IMFT или Toshiba. Наиболее близкую розничную цену имеют представители вышеупомянутой линейки Samsung SSD 840 EVO, но даже по спецификациям их производительность существенно выше, чем у аналогичных Crucial M500. Таким образом, если M500 в модификации 960 Гбайт занимает исключительное положение одного из нескольких имеющихся в продаже и одного из двух относительно доступных по цене SSD подобной емкости, да и M500 480 Гбайт выглядит привлекательно, то версии M500 объемом 120 и 240 Гбайт явно переоценены при их производительности.
Напоследок напомним, что Crucial M500 обладает уникальной особенностью — аппаратным полнодисковым шифрованием, которое совместимо с BitLocker в Windows 8. За сочетание относительно низкой цены и этой функции «почти терабайтный» Crucial M500 удостаивается медали «3DNews рекомендует».