Практический разгон процессора

Методы разгона процессора

Существует два метода overclocking"а: повышение частоты системной шины (FSB) и увеличение коэффициента умножения (множителя). На данный момент второй метод невозможно применить практически на всех серийных процессорах AMD. Исключениями из правил являются: процессоры Athlon XP (Thoroughbred, Barton, Thorton)/Duron (Applebred), выпущенные до 39 недели 2003 года, Athlon MP, Sempron (socket754; только понижение), Athlon 64 (только понижение), Athlon 64 FX53/55. В серийных процессорах производства Intel множитель также полностью заблокирован. Разгон процессора путем увеличения множителя является самым "безболезненным" и простым, т.к. возрастает только тактовая частота процессора, а частоты шины памяти, шин AGP/PCI остаются номинальными, поэтому определить максимальную тактовую частоту процессора, на которой он сможет работать корректно, с помощью данного способа особенно просто. Жаль, что сейчас найти в продаже процессоры AthlonXP с незаблокированным множителем довольно трудно, если вообще возможно. Разгон процессора посредством увеличения FSB имеет свои особенности. К примеру, с ростом частоты FSB растет частота шины памяти и частоты шин AGP/PCI. Особое внимание нужно обратить на частоты шин PCI/AGP, которые в большинстве чипсетов связаны с частотой FSB (не касается nForce2, nForce3 250). Обойти эту зависимость можно только если BIOS вашей материнской платы имеет соответствующие параметры — так называемые делители, отвечающие за отношение PCI/AGP к FSB. Рассчитать нужный вам делитель можно по формуле FSB/33, т.е., если частота FSB = 133 MHz, то следует 133 разделить на 33, и вы получите нужный вам делитель — в данном случае таковым является 4. Номинальной частотой для шины PCI являются 33 MHz, а максимальной — 38-40 MHz, выше ее устанавливать, мягко говоря, не рекомендуется: это может привести к выводу из строя PCI-устройств. По умолчанию частота шины памяти поднимается синхронно с частотой FSB, поэтому, если память не имеет достаточного потенциала для разгона, она может сыграть лимитирующую роль. Если очевидно, что частота оперативной памяти достигла своего предела, можно предпринять следующее:

  • Увеличить тайминги памяти (например, 2.5-3-3-5 изменить на 2.5-4-4-7 — это может помочь вам выжать еще несколько MHz из оперативки).
  • Повысить напряжение на модулях памяти.
  • Разгонять процессор и память асинхронно.

Чтение — мать учения

Для начала вам потребуется изучить инструкцию к своей материнской плате: найти разделы меню BIOS, отвечающие за частоту FSB, RAM, таймингов памяти, коэффициента умножения, напряжений, делителей частот PCI/AGP. Если в BIOS нет никаких из вышеприведенных параметров, тогда разгон можно осуществить с помощью перемычек (джамперов) на материнской плате. Назначение каждого джампера вы можете найти в той же инструкции, однако обычно на самой плате уже нанесена информация о функции каждого. Бывает, сам производитель намеренно скрывает "продвинутые" настройки BIOS — для их разблокировки требуется нажать определенное сочетание клавиш (такое часто встречается у материнских плат производства Gigabyte). Повторюсь: всю необходимую информацию можно найти в инструкции или на официальном сайте производителя материнской платы.

Практика

Заходим в BIOS (обычно для входа нужно нажать клавишу Del в момент пересчета объема оперативной памяти (т.е., когда появились первые данные на экране после перезагрузки/включения компьютера, жмите клавишу Del), но встречаются модели материнских плат и с иной клавишей для входа в BIOS — например, F2), ищем меню, в котором осуществляется изменение частоты системной шины, шины памяти и управление таймингами (обычно эти параметры расположены в одном месте). Думаю, что разгон процессора с помощью повышения множителя затруднений не вызовет, поэтому перейдем сразу к поднятию частоты системной шины. Поднимаем частоту FSB (примерно на 5-10% от номинала), потом сохраняем установленные изменения, перезагружаемся и ждем. Если все нормально, система запускается с новым значением FSB и как следствие с более высокой тактовой частотой процессора (и памяти, если вы разгоняете их синхронно). Загрузка Windows без каких-либо эксцессов означает, что полдела уже сделано. Далее запускаем программу CPU-Z (на момент написания статьи последней ее версией являлась 1.24) или Everest и удостоверяемся, что тактовая частота процессора возросла. Теперь нам нужно проверить процессор на стабильность — думаю, у каждого на винчестере есть дистрибутив 3DMark 2001/2003 — они хоть и предназначены для выявления быстродействия видеокарты, но для поверхностной проверки стабильности системы можно "погонять" и их. Для более серьезной проверки нужно использовать Prime95, CPU Burn-in 1.01, S&M (более подробно о программах-тестерах ниже). Если система прошла тестирование и ведет себя стабильно, перезагружаемся и начинаем все сначала: опять заходим в BIOS, еще повышаем частоту FSB, сохраняем изменения и тестируем систему заново. Если во время тестирования вас "выкинуло" из программы, система зависла или перезагрузилась, следует "откатиться" на шаг назад — на ту частоту процессора, когда система вела себя стабильно — и провести более объемное тестирование, чтобы удостоверится в полной стабильности работы. Не забывайте следить за температурой процессора и частотами шин PCI/AGP (в ОС частоту PCI и температуру можно посмотреть с помощью программы Everest или фирменных программ производителя материнской платы).

Повышение напряжения

Не рекомендуется повышать напряжение на процессоре более чем на 15-20%, а лучше, чтобы оно варьировалось в пределах 5-15%. Смысл в этом есть: повышается стабильность работы и открываются новые горизонты для разгона. Но будьте осторожны: вместе с повышением напряжения повышается потребляемая мощность и тепловыделение процессора и как следствие увеличивается нагрузка на блок питания и растет температура. Большинство материнских плат позволяют выставлять напряжение на оперативной памяти до 2,8-3,0 В, безопасной границей является 2,9 В (для дальнейшего увеличения напряжения нужно делать вольтмод материнской платы). Главное при повышении напряжения (не только на оперативной памяти) — контролировать тепловыделение, и, если оно увеличилось, организовать охлаждение разогнанного компонента. Одним из лучших способов определения температуры какого-либо компонента компьютера является прикосновение руки. Если вы не можете без боли от ожога дотронуться до компонента — ему требуется срочное охлаждение! Если компонент горячий, но руку держать можно, то охлаждение ему бы не помешало. И только если вы чувствуете, что компонент еле теплый или вообще холодный, то все хорошо, и охлаждения ему не нужно.

Тайминги и делители частоты

Тайминги — это задержки между отдельными операциями, производимыми контроллером при обращении к памяти. Всего их шесть: RAS-to-CAS Delay (RCD), CAS Latency (CL), RAS Precharge (RP), Precharge Delay или Active Precharge Delay (чаще обозначается как Tras), SDRAM Idle Timer или SDRAM Idle Cycle Limit, Burst Length. Описывать значение каждого — дело бессмысленное и никому не нужное. Лучше сразу выяснить, что лучше: маленькие тайминги или высокая частота. Существует мнение, что для процессоров Intel важнее тайминги, тогда как для AMD — частота. Но не стоит забывать, что для процессоров AMD чаще всего важна частота памяти, достигнутая в синхронном режиме. Для различных процессоров "родными" являются разные частоты памяти. Для процессоров Intel "своими" считаются следующие сочетания частот: 100:133, 133:166, 200:200. Для AMD на чипсетах nForce лучше синхронная работа FSB и RAM, а на связку AMD + VIA асинхронность влияет мало. На системах с процессором AMD частота памяти выставляется в следующих процентных соотношениях с FSB: 50%, 60%, 66%, 75%, 80%, 83%, 100%, 120%, 125%, 133%, 150%, 166%, 200% — это и есть те же делители, но представленные немного по-другому. А на системах с процессором Intel делители выглядят более привычно: 1:1, 4:3, 5:4 и т.д.

Черный экран

Да, бывает и такое:) — например, при переразгоне: вы просто установили такую тактовую частоту процессора или оперативной памяти (возможно, указали слишком низкие тайминги памяти), что компьютер не может запуститься — вернее, он запускается, но экран остается черным, и система не подает никаких "признаков жизни". Что делать в этом случае?

  • Многие производители встраивают в свои материнские платы систему автоматического сброса параметров на номинальные. И вот после такого "казуса" с завышенной частотой или низкими таймингами данная система должна выполнить свою "черную" работу, но это происходит не всегда, поэтому нужно быть готовым поработать ручками.
  • После включения компьютера нажать и удерживать клавишу Ins, после чего он должен успешно стартовать, а вы должны зайти в BIOS и установить рабочие параметры компьютера.
  • Если второй способ вам не помогает, нужно выключить компьютер, открыть корпус, найти на материнской плате джампер, отвечающий за сброс настроек BIOS — так называемый CMOS (обычно располагается около микросхемы BIOS) — и установить его в режим Clear CMOS на 2-3 секунды, а затем вернуть в номинальное положение.
  • Встречаются модели материнских плат без джампера сброса настроек BIOS (производитель делает ставку на свою автоматическую систему сброса настроек BIOS) — тогда нужно вынуть батарейку на некоторое время, которое зависит от производителя и модели материнской платы (я провел такой эксперимент на своей Epox EP-8RDA3G: вынул батарейку, подождал 5 минут, и настройки BIOS сбросились).

Информационные программы и утилиты

CPU-Z — одна из лучших программ, предоставляющих основные данные о процессоре, материнской плате и оперативной памяти, установленных в вашем компьютере. Интерфейс программы прост и интуитивен: нет ничего лишнего, а все самое важное на виду. Программа поддерживает самые последние новинки из мира "железа" и периодически обновляется. Последняя версия на момент написания статьи — 1.24. Размер — 260 Kb. Скачать программу можно по адресу cpuid.com .

Everest Home/Professional Edition (бывшая AIDA32) — информационно-диагностическая утилита, обладающая более продвинутыми функциями просмотра информации об установленном "железе", операционной системе, DirectX и т.п. Различия между домашней и профессиональной версией таковы: Pro-версия не имеет модуля тестирования оперативной памяти (чтение/запись), в ней также отсутствует довольно интересный подраздел Overclock, в котором собрана основная информация о процессоре, материнской плате, оперативной памяти, температуре процессора, материнской платы и винчестера, а также о разгоне вашего процессора в процентах:). В Home-версии нет учета ПО, расширенных отчетов, взаимодействия с базами данных, удаленного управления, функций уровня предприятия. В целом это и есть все различия. Сам я пользуюсь Home-версией утилиты, т.к. дополнительные возможности Pro-версии мне не нужны. Чуть не забыл упомянуть, что Everest позволяет просматривать частоту шины PCI — для этого нужно развернуть раздел Системная плата, кликнуть по подразделу с аналогичным названием и найти пункт Свойства шины чипсета/Реальная частота. Последняя версия на момент написания статьи — 1.51. Home-версия бесплатна и весит 3 Mb, Pro-версия платная и занимает 3,1 Mb. Скачать утилиту можно по адресу lavalys.com .

Тестирование стабильности

Название программы CPU Burn-in говорит само за себя: программа предназначена для "разогрева" процессора и проверки его стабильной работы. В главном окне CPU Burn-in вам нужно указать продолжительность, а в опциях — выбрать один из двух режимов тестирования:

  • тестирование с включенным контролем ошибок (Enable error checking);
  • тестирование с выключенным контролем ошибок, но с максимальным "разогревом" процессора (Disable error checking, maximum heat generation).

При включении первой опции программа проверит корректность вычислений процессора, а вторая позволит "разогреть" процессор практически до температур, близких к максимальным. CPU Burn-in весит около 7 Kb.

Следующей достойной программой для тестирования процессора и оперативной памяти является Prime95. Главным ее преимуществом является то, что при обнаружении ошибки программа самопроизвольно не "вешается", а выводит на рабочее поле данные об ошибке и времени ее выявления. Открыв меню Options -> Torture Test…, вы можете самостоятельно выбрать из трех режимов тестирования или указать свои параметры. Для более эффективного обнаружения ошибок процессора и памяти лучше всего задать третий режим тестирования (Blend: test some of everything, lots of RAM tested). Prime95 весит 1,01 Mb, скачать ее можно по адресу mersenne.org .

Относительно недавно свет увидела программа S&M. Сначала она задумывалась для проверки стабильности конвертера питания процессора, потом была реализована проверка оперативной памяти и поддержка процессоров Pentium 4 с технологией HyperThreading. На данный момент последней версией S&M 1.0.0(159) поддерживается более 32 (!) процессоров и имеется проверка стабильности работы процессора и оперативной памяти, кроме того, S&M имеет гибкую систему настроек. Суммировав все вышесказанное, можно утверждать, что S&M является одной из лучших программ в своем роде, если не самой лучшей. Интерфейс программы переведен на русский язык, поэтому запутаться в меню довольно сложно. S&M 1.0.0(159) весит 188 Kb, скачать ее можно по адресу testmem.nm.ru .

Вышеупомянутые программы-тестеры предназначены для проверки процессора и оперативной памяти на стабильность и выявления ошибок в их работе, все они бесплатны. Каждая из них нагружает процессор и память практически полностью, но хочу напомнить, что программы, применяемые в повседневной работе и не предназначенные для тестирования, редко могут так нагружать процессор и оперативную память, поэтому можно сказать, что тестирование происходит с определенным запасом.

Автор не несет никакой ответственности за поломку любого аппаратного обеспечения вашего компьютера, а также за сбои и "глюки" в работе любого программного обеспечения, установленного на вашем компьютере.

Микропроцессор персонального компьютера через шину FSB подключается к системному контроллеру или северному мосту чипсета . Системный контроллер имеет в своем составе контроллер ОЗУ (в некоторых микропроцессорах контроллер ОЗУ встроен в микропроцессор), а также контроллеры шин , к которым подключаются периферийные устройства .

Архитектура некоторых компьютеров предусматривает подключение к северному мосту наиболее производительных периферийных устройств, например графической платы с шиной PCI-Express 16х , а менее производительные устройства, например модуль BIOS с шиной PCI , подключаются кюжному мосту , который соединяется с северным мостом специальной шиной, например Hyper Transport , MuTIOL , V-Link , A-Link и т.д.

Таким образом, FSB работает в качестве магистрального канала между процессором и чипсетом.

Некоторые компьютеры имеют внешнюю кэш-память , подключенную через шину заднего плана процессора (Back Side Bus - ВSB) , которая обладает более высокой пропускной способностью чем шина FSB, но работает только со специфичными устройствами.

Каждая из вторичных шин, по отношению к шине FSB, работает на своей частоте, которая может быть как выше, так и ниже этой частоты. Иногда частота вторичной шины является производной от частоты FSB, а иногда задается независимо.

На системных платах старших поколений частота системы ОЗУ совпадала с частотой на шине FSB, на современных системных платах эти частоты могут отличаться.

В таблице ниже представлены сравнительные характеристики шин FSB для некоторых микропроцессоров.

Сравнительные характеристики шин FSB для некоторых процессоров

Все рассмотренные в таблице выше шины 64-разрядные. Самой быстрой из шин всех типов является QPB - одно из наиболее интересных усовершенствований в процессорах поколения Р7. Учетверенная внутренняя шина подкачки (Quad-Pumped Bus - QPB) синхронизируется внешней системной частотой 100, 133, 166, 200 или 266 МГц.

Процессор организует подкачку данных - четыре раза за такт системной синхронизации, т.е. с коэффициентом передачи 4х. Таким образом, частота на шине FSB возрастает и составляет соответственно 400, 533 и 800 МГц. Ширина шины QPB - 64 разряда, а это означает, что за один такт синхронизации по шине пересылается четыре пакета 64-разрядных данных.

Более ранние 64-разрядные шины компании Intel - логика хост-шины Host Bus, или GTL+ (Gunning Transceiver Logic) и AGTL+ (AssistedGunning Transceiver Logic) пересылают за такт синхронизации всего один пакет данных. Шины позволяют подключать до двух микропроцессоров, причем быстродействие при этом делится пополам.

Принцип работы шин CTI+ и ACTI+

Шина Alpha EV6, которую использовала компания AMD в своих микропроцессорах Athlon и Athlon ХР , позволяет передавать два пакета за такт по фронту и срезу импульса синхронизации. Ширина этой шины - 72 разряда, восемь из них используются для контроля достоверности кода данных ЕСС. Благодаря точечному подключению шина допускает без потери производительности подключить до 14-ти процессоров.

Принцип работы шины Alpha EV6

Процессоры AMD Athlon 64, AMD Athlon FX и Opteron имеют встроенный в процессор контроллер памяти, что несколько изменяет назначение FSB.


Лабораторная BIOS: настройка системной шины (FSB)

FSB (Front Site Bus) – системная шина, которая соединяет ЦП с северным мостом чипсета материнской платы. Системная шина обеспечивает взаимодействие процессора с компонентами компьютера. Частота системной шины – частота, с которой работает память. Иногда называется внешней частотой.

Частоты, на которых работают центральный процессор и FSB, имеют общую опорную частоту, и в конечном счёте определяются, исходя из их коэффициентов умножения (частота устройства = опорная частота * коэффициент умножения).

Память

Следует выделить два случая:

Контроллер памяти в системном контроллере

До определённого момента в развитии компьютеров частота работы памяти совпадала с частотой FSB. Это, в частности, касалось чипсетов на сокете LGA 775 , начиная с 945GC и вплоть до X48 .

То же касалось и чипсетов NVIDIA для платформы LGA 775 (NVIDIA GeForce 9400, NVIDIA nForce4 SLI/SLI Ultra и др.)

Спецификации стандартов системной шины чипсетов на сокете LGA 775 и оперативной памяти DDR3 SDRAM

Стандартное название Частота памяти, МГц Время цикла, нс Частота шины, МГц Эффективная (удвоенная) скорость, млн. передач/с Название модуля Пиковая скорость передачи данных при 64-битной шине данных в одноканальном режиме, МБ/с
DDR3‑800 100 10,00 400 800 PC3‑6400 6400
DDR3‑1066 133 7,50 533 1066 PC3‑8500 8533
DDR3‑1333 166 6,00 667 1333 PC3‑10600 10667
DDR3‑1600 200 5,00 800 1600 PC3‑12800 12800
DDR3‑1866 (O.C.) 233 (O.C.) 4,29 (O.C.) 933 (O.C.) 1866 (O.C.) PC3‑14900 (O.C.) 14933 (O.C.)

Что такое Front side bus?

FSB (Front Side Bus ) - системная шина процессора, обеспечивающая связь ЦП с остальной периферией (оперативная память, порты ввода-вывода, видеокарта, жесткий диск и др.).

FSB работает в качестве магистрального канала между процессором и чипсетом.
Частота системной шины измеряется в GHz или MHz.

Частота ЦП превышает частоту FSB, а процессор пересылает данные на частоте системной шины.

Величина, на которую частота процессора превышает частоту системной шины, называется множителем.
Чем выше частота системной шины, тем выше производительность процессора.

Драйвер AMD Radeon Software Adrenalin Edition 19.9.2 Optional

Новая версия драйвера AMD Radeon Software Adrenalin Edition 19.9.2 Optional повышает производительность в игре «Borderlands 3» и добавляет поддержку технологии коррекции изображения Radeon Image Sharpening.

Накопительное обновление Windows 10 1903 KB4515384 (добавлено)

10 сентября 2019 г. Microsoft выпустила накопительное обновление для Windows 10 версии 1903 - KB4515384 с рядом улучшений безопасности и исправлением ошибки, которая нарушила работу Windows Search и вызвала высокую загрузку ЦП.

Драйвер Game Ready GeForce 436.30 WHQL

Компания NVIDIA выпустила пакет драйверов Game Ready GeForce 436.30 WHQL, который предназначен для оптимизации в играх: «Gears 5», «Borderlands 3» и «Call of Duty: Modern Warfare», «FIFA 20», «The Surge 2» и «Code Vein», исправляет ряд ошибок, замеченных в предыдущих релизах, и расширяет перечень дисплеев категории G-Sync Compatible.

Драйвер AMD Radeon Software Adrenalin 19.9.1 Edition

Первый сентябрьский выпуск графических драйверов AMD Radeon Software Adrenalin 19.9.1 Edition оптимизирован для игры Gears 5.

Хотя процессоры Core i7 с интегрированным контроллером памяти уже анонсированы и доступны в магазинах, их присутствие на рынке остается и будет оставаться незначительным (по прогнозам самой же Intel), до выхода i5 еще есть время, так что пока сборщики будут продолжать готовить системы на базе процессоров предыдущей микроархитектуры. И конечно, задача оптимального подбора конфигурации при этом сохранит свою актуальность в применении к системам на базе Core 2. В данной статье мы в очередной раз рассмотрим несколько вариантов конфигураций памяти, чтобы понять, насколько быстрая и какого типа она нужна, чтобы раскрыть потенциал самых быстрых процессоров, но не переплачивать при этом понапрасну.

Вопрос о переплате абсолютно уместен, так как только «обычные» производители (вроде, скажем, Samsung и Hynix) продают соответствующие стандартам JEDEC модули, в характеристиках которых и указать-то нечего, кроме максимальной частоты, на которой они могут работать. Зато производители «элитной» памяти (Corsair, OCZ, GeIL и пр.) легко перекрывают заданные стандартом потолки и по частотам, и по напряжению питания (как правило, конечно, одновременно), за что вполне резонно хотят получить дополнительных денег. Более того, многие варианты платформ под процессоры Intel предполагают использование DDR3, а эта память, помимо того, что все еще дороже, чем DDR2, также провоцирует покупку «элитных» модулей, только теперь с совсем уж запредельными скоростными характеристиками. Кстати, такая память скорее всего не будет иметь перспектив при апгрейде, так как для процессоров на базе Nehalem есть официальная рекомендация производителя не поднимать напряжение модулей DDR3 выше 1,65 В.

Для исследования мы возьмем системные платы на двух топовых чипсетах: Intel X48 и NVIDIA nForce 790i Ultra SLI . Оба они обеспечивают максимальные возможные конфигурации для Core 2: полноценную поддержку PCI Express 2.0, поддержку всех стандартов памяти DDR3 (по крайней мере, при использовании модулей с расширением SPD - EPP 2.0 или XMP), поддержку частоты процессорной шины 400(1600) МГц. Сразу возникает вопрос: насколько актуальна последняя характеристика для обычных покупателей с учетом того факта, что до сих пор с частотой FSB 1600 МГц выпущен один-единственный процессор? Ответ: действительно, неактуальна, но исследование этого режима поможет нам выстроить более ясную общую картину, а кроме того, такой режим можно рассматривать как частный случай разгона, чтобы делать прикидки, какой памятью следует запасаться при желании разогнать процессор.

Исследование производительности

Тестовый стенд:

  • Процессоры:
    • Intel Core 2 Duo E6600 (2,4 ГГц, шина 1066 МГц)
    • Intel Core 2 Duo E8200 (2,66 ГГц, шина 1333 МГц)
    • Intel Core 2 Extreme QX9770 (3,2 ГГц, шина 1600 МГц)
  • Материнские платы:
    • MSI X48C Platinum (версия BIOS 7.0b6) на чипсете Intel X48
    • XFX nForce 790i Ultra 3-Way SLI (версия BIOS P03) на чипсете NVIDIA nForce 790i Ultra SLI
  • Память:
    • 2 модуля по 1 ГБ Corsair CM2X1024-9136C5D (DDR2-1142)
    • 2 модуля по 1 ГБ Corsair CM3X1024-1800С7DIN (DDR3-1800)
  • Видеокарта: PowerColor ATI Radeon HD 3870, 512 МБ
  • Жесткий диск: Seagate Barracuda 7200.7 (SATA), 7200 об/мин

Программное обеспечение:

  • ОС и драйверы:
    • Windows XP Professional SP2
    • DirectX 9.0c
    • Intel Chipset Drivers 8.3.1.1009
    • NVIDIA Chipset Drivers 9.64
    • ATI Catalyst 8.3
  • Тестовые приложения:
    • RMMA (RightMark Memory Analyzer) 3.8
    • RMMT (RightMark Multi-Threaded Memory Test) 1.1
    • 7-Zip 4.10b
    • Doom 3 (v1.0.1282)

Предваряя тестирование

Оба примененных чипсета, как уже было сказано выше, рассчитаны на память типа DDR3. К счастью, на базе чипсета Intel выпущено достаточное количество системных плат, предполагающих использование DDR2 или комбинированных, как примененная нами модель MSI.

Какие же конфигурации мы будем проверять? Здесь надо сделать традиционное вынужденное отступление и пояснить, что скорости операций с памятью ограничены собственно частотой и таймингами работы памяти, а также характеристиками процессорной шины, поскольку именно ее пропускная способность может лимитировать максимальную скорость перекачки данных из памяти и обратно. Действительно, начиная с момента использования двухканального доступа к DDR, пропускная способность памяти не уступает ПС системной шины, а со времен внедрения DDR2 - и значительно превосходит ее (для частоты FSB 1066 МГц, например, ПС шины составляет ~8533 МБ/с, что соответствует ПС двухканальной DDR2-533).

Но достаточно ли будет установить в плату два модуля DDR2-533 одновременно с процессором с FSB 1066 МГц? Однозначности ответа мешает еще как минимум такой параметр, как тайминги памяти. Из общих соображений понятно, что чем выше частота работы микросхемы памяти, тем больше должны быть относительные (выраженные в количестве тактов) задержки доступа к ней (просто потому, что время такта сократится). Однако на практике иногда, с одной стороны, удается обеспечить сохранение таймингов при повышении частоты (за счет того, что абсолютная задержка доступа может точнее уложиться в заданное количество тактов), а с другой стороны, в зависимости от организации микросхем и прочих параметров, при снижении частоты относительная задержка уже не может быть уменьшена, так как достигла предела рабочих характеристик. Таким образом, скажем, система с FSB 1066 МГц и двумя модулями DDR2-533, работающими при CL=4, должна, по идее, показать производительность чуть ниже, чем та же система с двумя модулями DDR2-667, работающими при той же задержке CL=4.

В нашем исследовании мы постарались обеспечить некоторое сочетание различных частот FSB, а также частоты и таймингов памяти, дополняя или проверяя результаты на двух чипсетах.

Результаты тестов при FSB 1066 МГц

Первым установим на тестовые стенды процессор с частотой FSB 1066 МГц. Как мы уже указали выше, с точки зрения величины пропускной способности при этой частоте шины достаточно использовать двухканальную DDR2-533. Впрочем, мы не включили в тестирование такую конфигурацию памяти, потому что DDR2-533 на рынке уже практически не представлена, так что ее цена неадекватна ситуации. Модули DDR2-667 и DDR2-800 представлены гораздо шире, но нельзя уверенно сказать, что между ними есть определенная разница по цене. Тем не менее, конфигурацию с двухканальной DDR2-667 мы все-таки рассмотрим - хотя бы из исследовательского интереса.

Мы уже отмечали в прошлых статьях, что при работе в равных режимах чипсет NVIDIA немного опережает решения Intel, а в синтетических тестах это иногда бывает заметно особенно хорошо. Также DDR3 в нынешних системах, как правило, немного медленнее, чем DDR2 (при использовании одинаковых скоростных режимов и таймингов). В дальнейшем не будем уделять внимания этим вопросам, если только разница не проявится в интересующем нас аспекте сравнения конфигураций памяти.

Традиционно начнем с низкоуровневого исследования потенциала памяти при помощи разработанного нашими программистами теста .

По данной диаграмме хорошо заметно, что скорость системы растет во всех случаях при увеличении частоты памяти до 1066 МГц, даже если это сопровождается повышением таймингов - иногда явно непропорциональным (например, абсолютные величины задержек доступа у DDR3-1066@7-7-7-20-1T гораздо хуже, чем у DDR3-800@5-5-5-16-1T). И лишь повышение частоты памяти до 1333 МГц ничего не дает (или, по крайней мере, перекрывается эффектом от повышения таймингов на шаг).

Картина при изучении скорости записи в память абсолютно соответствует описанной в предыдущем случае.

Неудивительно, что и тест латентности чтения из памяти демонстрирует те же соотношения, хотя в данном случае DDR3-1333 все-таки сумела чуть обойти DDR3-1066 по времени случайного доступа.

Теперь проверим, не изменится ли картина при многопоточном доступе в память: возможно, два ядра в конкурирующем режиме сумеют более эффективно использовать пропускную способность шины? Для этой цели используем тест RMMT (RightMark Multi-Threaded Memory Test) из пакета RMMA. (Для операций каждому потоку выделим по 32 МБ, дистанцию предвыборки данных будем подбирать индивидуально, чтобы максимизировать результат.)

Очевидно, что величина цифр несколько изменилась (многопоточное чтение идет чуть быстрее, многопоточная запись - чуть медленнее), однако взаимное расположение участников - нет.

Что ж, теперь проверим полученные данные на паре реальных приложений, а заодно оценим разницу в актуальных величинах.

Вооруженные результатами синтетических тестов, мы и не ожидали иного расклада. Производительность при архивировании (группа реальных тестов, наиболее сильно зависящих от скорости подсистемы памяти) действительно увеличивается с поднятием частоты памяти до 1066 МГц, даже при непропорциональном увеличении таймингов. В то же время, использование DDR3-1333 видимых дивидендов не приносит, хотя практически не снижает производительность, если тайминги при этом не слишком «задираются».

Производительность в играх подчиняется тем же закономерностям - по крайней мере, в тех игровых режимах, где скорость ограничена именно процессором и памятью, а не видеокартой.

Посмотрим на абсолютные величины выигрыша. В 7-Zip применение наиболее быстрой (де-факто) конфигурации на Intel X48 (DDR2-1066@5-5-5-16-2T) ускоряет систему с FSB 1066 МГц на 6,5% относительно базовой (DDR2-667@4-4-4-12-2T). Это не так уж мало: разница примерно соответствует 0,5 множителя частоты процессора, то есть при прочих равных такое ускорение обеспечивает ту же разницу, что и покупка процессора на одну модель старше. В Doom 3 аналогичный эффект равен и вовсе +8,3%. Главный же вывод из данной группы тестов: применение более скоростной памяти, вопреки чисто теоретическим выкладкам, обеспечивает ускорение системы вплоть до применения DDR2/DDR3-1066. Случайно ли, что максимальная эффективная частота памяти совпадает с частотой FSB? Попробуем найти ответ в следующих разделах.

Результаты тестов при FSB 1333 МГц

Теперь установим на тестовые стенды процессор с частотой FSB 1333 МГц. Опять-таки, с точки зрения величины пропускной способности при этой частоте шины достаточно использовать двухканальную DDR2-667. Поскольку штатные варианты DDR2 не могут даже приблизиться к этой частоте FSB, сосредоточимся мы на DDR3.

Скорость чтения из памяти по-прежнему уверенно растет при повышении частоты ее работы вплоть до 1333 МГц, даже в тех случаях, когда тайминги повышаются непропорционально (CL7 у DDR3-1333 в сравнении с CL5 у DDR3-1066). А вот частота памяти 1600 МГц прироста производительности не дает, и снижение абсолютной величины таймингов не помогает.

Впрочем, по скорости записи в память сравнительные результаты получаются чуть иными, но лишь в последнем пункте: здесь есть прирост и от повышения частоты памяти до 1600 МГц.

Результаты теста латентности чтения ближе к теоретическим выкладкам по подсчету таймингов: здесь выигрыш имеют те режимы, которые обеспечивают меньшие значения таймингов в абсолютных величинах. В итоге память с большей частотой всегда выигрывает но лишь поскольку (и насколько) имеет тайминги пониже.

Многопоточное чтение по-прежнему идет чуть быстрее, а многопоточная запись - чуть медленнее, а результаты в той же степени соответствуют результатам при однопоточном доступе в память.

Вряд ли кого-нибудь удивит практическое подтверждение синтетических тестов; по большому счету, интрига заключалась только в вопросе, сумеет ли DDR3-1600 при более низких таймингах опередить DDR3-1333. Практика деликатно уклонилась от прямого ответа на этот вопрос, предоставив нам самостоятельно оценивать статистическую погрешность тестирования. Что ж вполне можно признать эти режимы равными по скорости.

Теперь конкретные цифры разницы в реальных приложениях. 7-Zip уверенно отдает предпочтение чипсету NVIDIA, так что у нас есть два варианта сравнения: Intel X48 с DDR3 в лучшем случае выигрывает около 5,5% относительно режима с DDR2-667@4-4-4-12-2T, а NVIDIA nForce 790i Ultra - примерно столько же, но в сравнении с самым медленным режимом DDR3. Если бы мы рассматривали неофициальные скоростные вариации DDR2 (а производители такие модули предлагают), то, очевидно, могли бы получить и больший прирост на Intel X48, так как DDR2 на нем работает быстрее, а частота памяти задается независимо от ее типа. В случае Doom 3 максимальный прирост (из возможных штатных) на X48 составил почти 7%, у чипсета NVIDIA он скромнее, но и минимальный режим более скоростной.

В этом разделе тестов мы подтверждаем вывод о пользе применения более скоростной памяти, и лишь верхнюю границу однозначно определить затрудняемся: 1333 МГц достаточно, но хоть падения скорости от покупки DDR3-1600 с нормальными таймингами можно не ожидать.

Результаты тестов при FSB 1600 МГц

Наконец, настал черед единственного в своем роде процессора с частотой FSB 1600 МГц. Штатные возможности контроллера памяти в чипсете Intel не дадут нам создать здесь достаточно интересную непрерывную цепь показателей, так что воспользуемся по полной программе гибкостью контроллера памяти у NVIDIA nForce 790i Ultra. Вообще, такая частота FSB ограничивает минимальную частоту памяти на уровне 1066 МГц (только в случае контроллеров Intel, конечно), то есть штатные модули DDR2 здесь использовать невозможно. Это означает, что наше сравнение из практической плоскости «оправдана ли покупка нестандартной, более дорогой памяти?» переходит в чисто теоретическое «какая нестандартная память лучше?». Впрочем, не будем забывать и о DDR3 - там эти частоты вполне стандартны.

Что ж, вполне привычная по предыдущим частям сравнения картина: скорость чтения из памяти растет при повышении частоты ее работы вплоть до 1600 МГц, но не дальше, и, опять же, увеличение таймингов не нарушает эту закономерность.

Та же картина и при записи, только здесь еще более подчеркнута бесполезность и даже вредность DDR3-1800.

Впрочем, DDR3-1800 берет реванш в тесте латентности чтения: как ни крути, а абсолютные величины таймингов в этом режиме ниже.

Как мы помним по результатам первого тестирования процессора QX9770 с двухканальной DDR2-800, максимальная скорость многопоточного чтения достигается при конкурентной работе двух потоков, выполняющихся на физически разных ядрах, а максимальная скорость многопоточной записи - при конкурентной работе двух потоков, выполняющихся на ядрах, относящихся к физически единому ядру (разделяющих общий кэш L2). Дополнив прежнюю конфигурацию тестовых стендов чипсетом NVIDIA и куда более скоростными модулями памяти, мы получили следующие интересные наблюдения:

  1. на NVIDIA nForce 790i Ultra SLI скорость чтения практически одинакова при работе двух потоков, выполняющихся на физически разных ядрах и на ядрах, относящихся к физически единому ядру (а четырехпоточное чтение существенно медленнее);
  2. скорость чтения с предвыборкой происходит на NVIDIA nForce 790i Ultra SLI существенно быстрее в случае чтения в два потока с ядер, относящихся к физически единому ядру (а четырехпоточный вариант вновь заметно медленнее остальных);
  3. зато максимальная скорость записи на NVIDIA nForce 790i Ultra SLI выше именно при работе двух потоков на физически разных ядрах, запись в 4 потока занимает промежуточное положение по скорости.

Для наших целей возьмем именно максимальные показатели, полученные, таким образом, при немного отличающихся условиях тестирования многопоточных чтения и записи.

В случае чипсета Intel преимущества от использования DDR3-1600 очевидны; у чипсета NVIDIA разница между разными режимами отнюдь не так впечатляет, но общий итог прежний: более быстрая (но не быстрее FSB) память дает некоторый выигрыш в скорости.

Тем важнее практическая проверка, и ее результаты не столь оптимистичны: различия между режимами с памятью разной частоты укладываются в 2-3%, что вряд ли можно считать серьезным стимулом для покупки топовых модулей памяти.

Таким образом, «полусинтетический» раздел тестов позволил нам подтвердить вывод о принципиальной пользе применения более скоростной памяти, с небольшим максимумом в районе DDR3-1600, но реально измеримого превосходства в производительности относительно базовой DDR3-1066 можно не ждать. Еще раз напомним, что этот вывод относится не только к крайне немногочисленным обладателям QX9770, но и ко всем оверклокерам, серьезно увеличивающим частоту FSB для разгона процессора.

Выводы

Здесь нам остается только свести воедино результаты, полученные при тестировании в трех группах конфигураций, и соотнести их с изначальным вопросом статьи.

Итак, в случае распространенных процессоров семейства Core 2 с частотой FSB 1066/1333 МГц, вопреки чисто теоретическим выкладкам, имеет некоторый смысл использовать двухканальную память, существенно превосходящую по пропускной способности штатную системную шину. Если взять за опорную точку конфигурацию с DDR2-667 (как наиболее дешевый из реально представленных на рынке вариантов), то применением быстрой DDR2 или DDR3 можно выиграть 6-7-8% в реальных приложениях. Еще раз повторим, что это не так уж мало: разница примерно соответствует 0,5 множителя частоты процессора, то есть при прочих равных такое ускорение обеспечивает ту же разницу, что и покупка процессора на одну модель старше. Но, конечно, на ускорение в разы рассчитывать не стóит.

Память при этом оптимально подбирать такую, которая способна работать «псевдосинхронно» с FSB (их опорные частоты должны совпадать), не слишком задирая при этом тайминги (в абсолютных величинах, конечно). Будет ли такая покупка оправдана по большому счету? Почти всегда нет, так как разница в стоимости модулей «оверклокерской» и «обычной» памяти легко может составлять несколько раз (давая выигрыш, напомним, на 6–8%) - хотя вывод, безусловно, будет зависеть и от стоимости системы в сборе. Однако будут и ситуации, когда такая покупка явится наиболее рациональным способом улучшения системы - например, при намерении купить топовый или околотоповый процессор в линейке.

Сделанные выводы останутся справедливыми и для варианта разгона процессора, но тогда платы на наиболее популярных чипсетах (Intel) просто физически не позволят использовать память с низкой частотой работы, а значит, опорная точка в любом случае сместится в сторону более дорогих и производительных модулей. В итоге выигрыш от применения, скажем, DDR3-1600/1800 будет существенно меньше (в районе 2-3%), хотя и разница в цене модулей памяти несколько нивелируется.