September 18, 2019, 07:30:39 am

News:

Have you visited the Allwinner Chipset wiki? - http://linux-sunxi.org/


[Решено] Стабильность работы CB2

Started by luminofor, March 05, 2014, 11:12:37 pm

Previous topic - Next topic

Раджа

Кубик работает на Cubian с последним доступным через апдейтер ядром. На нем крутится веселуха из разных сервисов, в т.ч. i2p. Аптайм уже две недели точно.
Заткнись и смотри аниме!

luminofor

Quote from: ua3prq on May 13, 2014, 02:50:39 am
Хочется все таки от тебя услышать путь до фикса, что было "до" (что "после" стало- понятно).

Виснуть кубик начал практически сразу. О том, что место установки (sd/hdd или nand) играет роль, я пока не знал. На любом дистрибутиве. Перепробовал я все что находил на базе debian или ubuntu. Потом появилась догадка, что кубик уходит в спячку и не может выйти из нее. На это меня натолкнула зависшая картинка скринсейвера. Я прибил скринсейвер вместе со спящим режимом. Не помогло. Думаю, ладно, попробую чистую консоль без иксов. Кубик точно так же зависал.
Заметил особенность - пока нет обращения к жесткому диску, кубик стабилен. Стал грешить на винт и блок питания. Поставил туеву кучу кондеров по питанию, укоротил провода до минимума, сменил винт. Начал искать инфу. Нашел в англоязычной ветке свою проблему. Почитал.
Самое простое решение проблемы было - перенести систему в nand. Попробовал - получилось. Почему то, когда система стоит в nand частота памяти 432МГц, а на карте или винте - 480.
Правка script.bin ни на что не влияет, хоть какую частоту там указывай.
Попробовал на работе под минтом скомпилить u-boot, с измененными параметрами частоты - ничего не вышло. Хотя потом прямо на кубике получилось. В итоге залил тот u-boot, что мне выложили и проблема ушла.
Вот вкратце мои двухмесячные мучения :-)

Отправлено с моего Hongmi через Tapatalk


ua3prq

Quote from: pako on May 13, 2014, 03:18:05 am
оказалось процесс гувернера управления частотой процессора загружал проц на 100% и в итоге кубитрак переставал отвечать. После отключения этой хреньки все работает нормально, хотя прошло всего 2 недели, но зависаний небыло.


Знаю, что есть такая штука, но еще не копал. Насколько я понимаю сервис следит за нагрузкой ЦП и динамически аппаратно корреектирует частоту ЦП? Встречал попытки некоторых делать оверклок выше 1080Мгц (считаю, что это на пользу не пойдет уж точно).
Покажите свои наработки, не стесняйтесь  ;) Какой дистр, на каком носителе, где-что подшаманить (тупо отключить сервис?) ...

ua3prq

May 14, 2014, 12:34:16 am #48 Last Edit: May 14, 2014, 01:52:51 pm by ua3prq
Quote from: luminofor on May 13, 2014, 11:04:48 am
...skip
В итоге залил тот u-boot, что мне выложили и проблема ушла.
Вот вкратце мои двухмесячные мучения :-)


Теперь понятно в чем дело, на разных дистрах имеем разный u-Boot + SPL. Т.к. напрямую один и тот же загрузчик нельзя использовать для SD/NAND (и перекомпилировать) предполагаю, что сборщики просто надергали для конструкторов, что было им доступно. Поэтому модули SPL разные.

А вот, что получилось у меня следом:
Дистр "Wheezy server for SD, SATA or NAND with hotspot  v1.8" (на 1.7 аналогично, проверил):
dram_clk          = 480
dram_type         = 3
dram_rank_num     = 1
dram_chip_density = 4096
dram_io_width     = 16
dram_bus_width    = 32
dram_cas          = 9
dram_zq           = 0x7f
dram_odt_en       = 0
dram_tpr0         = 0x42d899b7
dram_tpr1         = 0xa090
dram_tpr2         = 0x22a00
dram_tpr3         = 0x0
dram_emr1         = 0x4
dram_emr2         = 0x10
dram_emr3         = 0x0


Результат налицо  :(
Хотя видно, что разработчики пока все используют cas-9. Полемика в GG по этому поводу завершилась тем, что использовать cas-6 для данных чипов памяти выглядит слишком жестоко. Остается только клок. Буду пробовать на днях тоже понизить частоту и свяжусь с Игорем, какая у него статистика. У него катается трак (имеющий более стабильную разводку платы в области DDR), но в ветке встречаются сообщения о нестабильности, хотя он сам лично уже начал использовать оверклок ЦПУ.

pako

Quote from: ua3prq on May 14, 2014, 12:10:55 am
Quote from: pako on May 13, 2014, 03:18:05 am
оказалось процесс гувернера управления частотой процессора загружал проц на 100% и в итоге кубитрак переставал отвечать. После отключения этой хреньки все работает нормально, хотя прошло всего 2 недели, но зависаний небыло.


Знаю, что есть такая штука, но еще не копал. Насколько я понимаю сервис следит за нагрузкой ЦП и динамически аппаратно корреектирует частоту ЦП? Встречал попытки некоторых делать оверклок выше 1080Мгц (считаю, что это на пользу не пойдет уж точно).
Покажите свои наработки, не стесняйтесь  ;) Какой дистр, на каком носителе, где-что подшаманить (тупо отключить сервис?) ...


Обнаружил что перед зависанием загорается белый светодиод (нагрузка на первое ядро) и через секунд 10 все падает, кубитрак перестает отвечать. В очередной раз когда это произошло я как раз был залогинен по ssh и был открыт top. Оказалось что это процесс CFINTERACTIVE грузил ядро на 100%. Погуглив я опеределил что это управление частотой процессора, и полазив в /etc/init.d я нашел файлик cpufrequtils, в котором заменил ENABLE="true" на ENABLE="false"- проблемма вроде ушла, по крайней мере 2 недели аптайма без зависаний. Дистрибутив дебиан от словении, но старая версия 1.3 или 1.4. Ядро правда обновил на 3.4.79 от Patwood.

ua3prq

May 15, 2014, 12:15:34 am #50 Last Edit: May 15, 2014, 12:18:44 am by ua3prq
Вчера пропатчил систему на CB2, теперь 432МГц. Буду набирать аптайм, о результатах отпишу...

dd if=u-boot-sunxi-with-spl.bin of=/dev/mmcblk0 bs=1024 seek=8

Раджа

Пока тема тут в таком направлении, спрошу.

u-boot + spl из git я собирал, но прописывать в загрузчик смелости не набрался. :) Есть ли истории успеха?
Заткнись и смотри аниме!

ua3prq

May 16, 2014, 02:46:09 am #52 Last Edit: May 16, 2014, 02:50:57 pm by ua3prq
Quote from: Раджа on May 15, 2014, 11:48:18 pm
u-boot + spl из git я собирал, но прописывать в загрузчик смелости не набрался. :) Есть ли истории успеха?

Пока в процессе. Правда я влил (как выше) готовый бинарник. Но уже на вторые сутки получил фриз системы во время просмотра аниме по самбе. Из серьезного еще запущен только демон трансмиссии (и то без особой нагрузки, вся ОС где-то под 30-40%).
Так что еще подожду, что получится. И дальше уже, как советуют, тогда затем займусь говернором.

Вчера приехало обновление самбы, еще бы понять, может кто конкретный виновник.

ЗЫ: а перед загрузчиком, не поленился вынуть карту и слить в имадж-бэкап все сразу (на всякий таежный случай)  ;)

luminofor

Quote from: Раджа on May 15, 2014, 11:48:18 pm
Пока тема тут в таком направлении, спрошу.

u-boot + spl из git я собирал, но прописывать в загрузчик смелости не набрался. :) Есть ли истории успеха?


А чего бояться, делаешь копию, заливаешь бинарник. Не нравится - восстанавливаешь из копии  ;)

ua3prq

May 20, 2014, 03:25:27 pm #54 Last Edit: May 22, 2014, 12:54:56 am by ua3prq
После 4-х непрерывных дней под небольшой нагрузкой (LAV-0.25) получил очередной фриз. Вообщем понижение частоты не очень то и помогло  :(
Есть у кого готовый SPL ниже 432МГц, попробовать ? киньте сюда...

Пока переключил в БП на свой новый конвертер питания 5В, посмотрю результат, вдруг поможет  ;D

Дальше по порядку придется колдовать с частотой процессора, действительно- говернор в работе и наблюдаю постоянное изменение тактовой CPU в районе 500-1000МГц.

pako

В общем у меня почти месяц после отключения управления частотой процессора- ни одного зависания. Вся моя проблема только в нем была, а то я уже думал городить железячный вачдог.

ssvb

May 30, 2014, 06:14:35 am #56 Last Edit: May 30, 2014, 06:18:06 am by ssvb
Quote from: ua3prq on May 20, 2014, 03:25:27 pm
После 4-х непрерывных дней под небольшой нагрузкой (LAV-0.25) получил очередной фриз. Вообщем понижение частоты не очень то и помогло  :(
Есть у кого готовый SPL ниже 432МГц, попробовать ? киньте сюда...

Для тестирования надёжности работы памяти попробуйте https://github.com/ssvb/lima-memtester/
Инструкции есть тут: http://linux-sunxi.org/Hardware_Reliability_Tests

Скорее всего у вас слишком низкое напряжение dcdc3. Это исправляется в fex файле - https://www.mail-archive.com/[email]linux-sunxi@googlegroups.com[/email]/msg04662.html

QuoteДальше по порядку придется колдовать с частотой процессора, действительно- говернор в работе и наблюдаю постоянное изменение тактовой CPU в районе 500-1000МГц.

С cpufreq говернором тоже есть проблема на некоторых устройствах из-за слишком низких напряжений на некоторых тактовых частотах (и тоже исправляется с помощью изменений в fex по ссылке выше).

ua3prq

Спасибо, попробую!

---
Tapatalk MSG


Hve

June 14, 2014, 03:24:00 pm #58 Last Edit: June 14, 2014, 03:52:25 pm by Hve
Хмм... Нездоровая веселуха. Кстати есть огромное подозрение что как раз из-за нестабильности работы оперативки дамп при выключении питания сбрасывается куда попало (на таблицу размещения разделов попадает) и разделы портятся. Кто что думает? Заметил ещё одну особенность: На ревизии А чипы оперативки стоят 16CP-BH F42 и всё работает стабильно. На ревизии В уже 16BP-BH 30. Может и в этом дело быть. Быстро-фикс со script.bin конечно работает железобетонно, но хотелось бы и доступ к nand иметь

johndoe_71rus

Когда nand слетает после загрузки линукса с флешки, вроде бы прояснилось. Allwiner в закрытых дровах для nand что то изменили. Как обычно, одно починили другое поломали. Предположительно в ядре 3.4 android. В линукс ядре используется более старая версия nand драйвера. Возможно в ядре линукса допилят проверку на тип nand данных. А может и поддержку сделают.
Cubieboard2 / Android 4.2.2 / Cubieez 7.4@3.4.79+patwood