Bonjour à tous,
Je me suis inscris sur ce forum qui semble être spécialisé sur l'overclocking et les problèmes lié à cette pratique.
Alors mon problème n'a pas de lien direct à l'overclocking, toutefois je patauge et suis un peu désespéré de trouver la cause de mon problème et je me dis qu'avoir des conseils de personnes qui maitrisent les paramètres de cet art pourrait m'aider.
Je possède une carte mère Supermicro X10SL7-F pour une utilisation serveur de stockage. Cette carte dispose de 4 emplacements ram (DIMMA1 - DIMMA2 - DIMMB1 et DIMMB2) pour 4x8Go = 32Go de ram maximum.
Mon système dispose d'un core i3-4130T et jusqu'à récemment 2x8Go de ram Crucial CT102472BD160B. L'ensemble carte mère - cpu - ram fonctionne en mode ECC.
Mon système fonctionne depuis 6 ans 24/24 sans aucun problème.
Récemment afin de compléter les emplacements vide de ram, j'ai décidé d'acheter 2 barrettes de ram supplémentaires (d'occas) de même référence.
Problème : lorsque j'ai installé les deux nouvelles barrettes sur DIMMB1 et DIMMB2, cela a provoqué 4 bips courts anormales de la carte mère.
Je vais maintenant vous donner tout plein d'informations / remarques / retour de tests :
_ le BIOS (aptio) est à jour dans sa dernière version.
_ la signification des 4 bips courts ne sont pas répertoriés dans le manuel, et je n'en ai pas le détails.
_ pour mes tests, je dispose d'un liveUSB de memtest86 version 9.4 free, d'un liveUSB de linux mint, d'un disque dur où sont installés Windows 10 et Linux Mint en dual boot
_ je ne dispose d'aucun autre système pour tester le cpu ou les barrettes.
_ suite aux tests que j'ai effectué ci-après, j'ai remarqué que j'arrive à démarrer le système une fois sans problème quelque soit le nombre de ram (>2) installées ou leur emplacement sur la carte. Si j'éteins le système et que je le rallume, le problème survient sous une forme ou sous une autre (voir les formes évoquées plus bas). Il me suffit d'enlever une barrette, d'échanger une barrette avec une autre, ou d'en remettre une pour pouvoir de nouveau démarrer le système sans problème (une seule fois).
_TEST 1 : tentatives de différentes configuration barrettes/slots
Conclusion :
_ quelque soit la combinaison avec seulement 2 barrettes sur DIMMA1 et DIMMA2, aucun problème détecté
_ le problème intervient dès qu'il y a une troisième barrette de ram.
_ le problème survient de 3 manières différentes :
Conclusion : aucune erreur détectée par le logiciel
_TEST 3 : chaque barrette de ram a été testée seule sur chacun des 4 emplacements ram
Protocole de test :
1] lancement d'un liveUSB linux mint avec navigation succincte (ouvrir des logiciels, naviguer dans les dossiers, pas plus d'une minute)
2] extinction
3] lancement memtest86 (1 pass / 13 tests)
4] Ctrl+Alt+Suppr pour redémarrer le système
5] au redémarrage, lancement du LiveUSB linux mint avec navigation succincte (ouvrir des logiciels, naviguer dans les dossiers, pas plus d'une minute)
Conclusion du test :
_ aucune erreur sur aucun test n'a été détecté par memtest86
_ à aucun moment je n'ai eu les 4 bips d'erreur au démarrage. Je n'ai eu que les bips normalement émis lorsque tout va bien.
_ pour chaque premier démarrage, je n'ai jamais eu de problème de latence ou autre. C'est lors du second démarrage que ça se gâte et où il arrive des (très, très) grosses latences.
_ les problèmes ne sont arrivés que sur le canal B => DIMMB1 et DIMMB2
_ TEST 4 : je ne l'avais pas vu au début, mais il s'avère que des logs sont présents dans le bios
Il y avait les messages suivants :
Smbios 0x01 DIMMB1 Single bit ECC memory error (x20 fois)
Smbios 0x02 DIMMB1 Multi bit ECC memory error (x3 fois)
Smbios 0x01 DIMMB2 Single bit ECC memory error (x1 fois)
Après plusieurs tests, il s'avère que :
_ces codes d'erreur sont générés quand j'arrive à lancer un système et qu'il se mets en mode grosse latence. Lorsque j'ai les 4 bips d'erreur à l'initialisation, le système doit détecté quelque puisque ça bip, mais n'enregistre pas dans les logs à ce moment là.
_après avoir réalisé de nombreuses combinaisons de barrette/slots, il semble que les messages d'erreur dans les logs n'apparaissent que sur DIMMB1 et DIMMB2. Toutefois pour quasiment toute les combinaisons testées, je n'ai que les 4 bips d'erreurs, erreur qui ne sont donc pas référencés dans les logs. Comme dit plus haut, les erreurs semblent être référencées plus tard dans le démarrage système => résultats de test à prendre avec recul.
_TEST 5 : comme les erreurs sont enregistrés dans les logs lorsque j'arrive à lancer un système, et comme pour tout premier lancement le système semble stable, j'ai voulu savoir si le système restait stable sur une plus longue durée et si des erreurs pouvaient apparaitre.
Pour cela, j'ai resetté les logs bios, je me suis arrangé pour pouvoir démarrer sur windows avec un OS fonctionnel, et avec mes 4 barrettes de ram installées, j'ai laissé tourné toute la nuit. => le lendemain , l'OS était toujours réactif, pas de problème de latence.
Du coup je me suis dit j'allais pousser un peu le système, j'ai téléchargé le logiciel memtest de cet éditeur : https://hcidesign.com/memtest/
C'est un logiciel qui stress la ram disponible sur windows en fonctionnement. Le logiciel a tourné toute l'après midi sans détecter une erreur.
_ par ailleurs au milieu de tout cela, la carte mère a été démontée :
Peut-être des paramètres à configurer dans le bios ,.....
Je ne suis pas un grand connaisseurs de tout cela, et je suis un peu perdu.
J'espère que tout ce que j'ai évoqué ci-dessus est clair, sinon n'hésitez pas.
Dans l'attente de vos retours, suggestions
Merci
Je me suis inscris sur ce forum qui semble être spécialisé sur l'overclocking et les problèmes lié à cette pratique.
Alors mon problème n'a pas de lien direct à l'overclocking, toutefois je patauge et suis un peu désespéré de trouver la cause de mon problème et je me dis qu'avoir des conseils de personnes qui maitrisent les paramètres de cet art pourrait m'aider.
Je possède une carte mère Supermicro X10SL7-F pour une utilisation serveur de stockage. Cette carte dispose de 4 emplacements ram (DIMMA1 - DIMMA2 - DIMMB1 et DIMMB2) pour 4x8Go = 32Go de ram maximum.
Mon système dispose d'un core i3-4130T et jusqu'à récemment 2x8Go de ram Crucial CT102472BD160B. L'ensemble carte mère - cpu - ram fonctionne en mode ECC.
Mon système fonctionne depuis 6 ans 24/24 sans aucun problème.
Récemment afin de compléter les emplacements vide de ram, j'ai décidé d'acheter 2 barrettes de ram supplémentaires (d'occas) de même référence.
Problème : lorsque j'ai installé les deux nouvelles barrettes sur DIMMB1 et DIMMB2, cela a provoqué 4 bips courts anormales de la carte mère.
Je vais maintenant vous donner tout plein d'informations / remarques / retour de tests :
_ le BIOS (aptio) est à jour dans sa dernière version.
_ la signification des 4 bips courts ne sont pas répertoriés dans le manuel, et je n'en ai pas le détails.
_ pour mes tests, je dispose d'un liveUSB de memtest86 version 9.4 free, d'un liveUSB de linux mint, d'un disque dur où sont installés Windows 10 et Linux Mint en dual boot
_ je ne dispose d'aucun autre système pour tester le cpu ou les barrettes.
_ suite aux tests que j'ai effectué ci-après, j'ai remarqué que j'arrive à démarrer le système une fois sans problème quelque soit le nombre de ram (>2) installées ou leur emplacement sur la carte. Si j'éteins le système et que je le rallume, le problème survient sous une forme ou sous une autre (voir les formes évoquées plus bas). Il me suffit d'enlever une barrette, d'échanger une barrette avec une autre, ou d'en remettre une pour pouvoir de nouveau démarrer le système sans problème (une seule fois).
_TEST 1 : tentatives de différentes configuration barrettes/slots
Conclusion :
_ quelque soit la combinaison avec seulement 2 barrettes sur DIMMA1 et DIMMA2, aucun problème détecté
_ le problème intervient dès qu'il y a une troisième barrette de ram.
_ le problème survient de 3 manières différentes :
- soit 4 bips courts au moment de l'initialisation système (avant le moment où je peux invoquer le BIOS avec la touche "Suppr")
- pas de bips anormaux au démarrage, l'OS arrive à se lancer, mais arrivé sur le système, survient une très grosse latence qui ne permet plus de faire quelque chose sur le système
- le système redémarre en boucle
Conclusion : aucune erreur détectée par le logiciel
_TEST 3 : chaque barrette de ram a été testée seule sur chacun des 4 emplacements ram
Protocole de test :
1] lancement d'un liveUSB linux mint avec navigation succincte (ouvrir des logiciels, naviguer dans les dossiers, pas plus d'une minute)
2] extinction
3] lancement memtest86 (1 pass / 13 tests)
4] Ctrl+Alt+Suppr pour redémarrer le système
5] au redémarrage, lancement du LiveUSB linux mint avec navigation succincte (ouvrir des logiciels, naviguer dans les dossiers, pas plus d'une minute)
Conclusion du test :
_ aucune erreur sur aucun test n'a été détecté par memtest86
_ à aucun moment je n'ai eu les 4 bips d'erreur au démarrage. Je n'ai eu que les bips normalement émis lorsque tout va bien.
_ pour chaque premier démarrage, je n'ai jamais eu de problème de latence ou autre. C'est lors du second démarrage que ça se gâte et où il arrive des (très, très) grosses latences.
_ les problèmes ne sont arrivés que sur le canal B => DIMMB1 et DIMMB2
_ TEST 4 : je ne l'avais pas vu au début, mais il s'avère que des logs sont présents dans le bios
Il y avait les messages suivants :
Smbios 0x01 DIMMB1 Single bit ECC memory error (x20 fois)
Smbios 0x02 DIMMB1 Multi bit ECC memory error (x3 fois)
Smbios 0x01 DIMMB2 Single bit ECC memory error (x1 fois)
Après plusieurs tests, il s'avère que :
_ces codes d'erreur sont générés quand j'arrive à lancer un système et qu'il se mets en mode grosse latence. Lorsque j'ai les 4 bips d'erreur à l'initialisation, le système doit détecté quelque puisque ça bip, mais n'enregistre pas dans les logs à ce moment là.
_après avoir réalisé de nombreuses combinaisons de barrette/slots, il semble que les messages d'erreur dans les logs n'apparaissent que sur DIMMB1 et DIMMB2. Toutefois pour quasiment toute les combinaisons testées, je n'ai que les 4 bips d'erreurs, erreur qui ne sont donc pas référencés dans les logs. Comme dit plus haut, les erreurs semblent être référencées plus tard dans le démarrage système => résultats de test à prendre avec recul.
_TEST 5 : comme les erreurs sont enregistrés dans les logs lorsque j'arrive à lancer un système, et comme pour tout premier lancement le système semble stable, j'ai voulu savoir si le système restait stable sur une plus longue durée et si des erreurs pouvaient apparaitre.
Pour cela, j'ai resetté les logs bios, je me suis arrangé pour pouvoir démarrer sur windows avec un OS fonctionnel, et avec mes 4 barrettes de ram installées, j'ai laissé tourné toute la nuit. => le lendemain , l'OS était toujours réactif, pas de problème de latence.
Du coup je me suis dit j'allais pousser un peu le système, j'ai téléchargé le logiciel memtest de cet éditeur : https://hcidesign.com/memtest/
C'est un logiciel qui stress la ram disponible sur windows en fonctionnement. Le logiciel a tourné toute l'après midi sans détecter une erreur.
_ par ailleurs au milieu de tout cela, la carte mère a été démontée :
- j'ai vérifié les soudures des emplacements RAM ainsi que les languette de contact (avec et sans ram) => RAS
- j'ai vérifié s'il n'y avait pas un condensateur gonflé ou autre => RAS
- j'ai démonté le processeur et nettoyé les contacts.
- j'ai lancé le logiciel IPDT.exe, le logiciel de diagnostic d'intel => RAS
- => le problème persiste
Peut-être des paramètres à configurer dans le bios ,.....
Je ne suis pas un grand connaisseurs de tout cela, et je suis un peu perdu.
J'espère que tout ce que j'ai évoqué ci-dessus est clair, sinon n'hésitez pas.
Dans l'attente de vos retours, suggestions
Merci
Dernière édition: