2022年6月22日水曜日

Primelib は SiliconSmart と同じ

 タイトルそのまま.同じスクリプトがそのまま動きます.むしろ起動時に
> Reading  /cad/synopsys/primelib/T-2022.03-1/etc/sis.err...done
なんてログが出てくるので,「さては SiliconSmart だな,テメー」,という気分になります.

2022年6月16日木曜日

集積回路における信頼性問題の具体例

忘れるのでメモ.

・ハードエラー関係
Intel、新チップセット「Intel 6シリーズ」で不具合、一部店舗で対応製品の販売停止も
https://tech.nikkeibp.co.jp/it/pc/article/news/20110201/1029919/
Intel Sandy Bridge chipset flaw prompts recall
https://www.expertreviews.co.uk/pcs/motherboards/23631/intel-sandy-bridge-chipset-flaw-prompts-recall

Atom C2000ファミリに18カ月前後の動作で起動できなくなるエラッタ
https://pc.watch.impress.co.jp/docs/news/1045715.html
Semi-Critical Intel Atom C2000 SoC Flaw Discovered, Hardware Fix Required
https://www.anandtech.com/show/11110/semi-critical-intel-atom-c2000-flaw-discovered

Apollo Lakeが長期稼働で信号劣化し品質基準を満たさず。ステッピング変更へ
https://pc.watch.impress.co.jp/docs/news/1206703.html

ソースが無いが,2件ともコアトランジスタに IO 電源をつないでしまったためのHCIでの劣化が原因と言われていた気がする.

・ソフトエラー関係
HOW TO KILL A SUPERCOMPUTER: DIRTY POWER, COSMIC RAYS, AND BAD SOLDER
https://spectrum.ieee.org/how-to-kill-a-supercomputer-dirty-power-cosmic-rays-and-bad-solder
日本語の記事はこちらが詳しい
スーパーコンピューターの系譜 Chen博士がCRAYの後に手がけたSS-1
https://ascii.jp/elem/000/001/130/1130264/
ECC によって保護されていないため宇宙線による誤動作が多発し,その部分を無効化して性能を猛烈に悪化させつつ使うか,そもそもまともに長時間動かせなくて諦めた,というお話である.

Intel reveals Itanium 2 glitch (23/11/07追記)
https://www.cnet.com/tech/tech-industry/intel-reveals-itanium-2-glitch/
「高温下において特定のデータを特定の順番で処理を実施した」時に,システムが不正にシャットダウンし保存データに異常が発生するとのこと.対策として周波数を800MHzまで落とすか,マザーボードを作り替えるか,CPUを入れ替えるらしい.結局何が原因なのかはわからなかったが,状況から考えるとIR-Dropかdi/dtノイズだろうか.

・パッケージ関係
富士通の HDD コントローラ突然死
http://www.shippai.org/fkd/cf/CA0000624.html
https://xtech.nikkei.com/dm/article/NEWS/20050506/104444/
富士通の HDD に積んだ Cirrus Logic 製のコントローラ LSI がパッケージに起因する経年劣化で死亡するという話.日経では「富士通が製造を委託した」とあるが,がっつり Cirrus Logic のロゴが入っているし LSI チップを買ったようだ.パッケージ材料である住友ベークライトの「EME-U」に含まれる無機リンを構成する赤リンおよびその皮膜が高温高湿下でリン酸になり,それがピンの材料である Ag を溶かし配線を短絡した.

パッケージ起因のソフトエラー
[1] T. C. May and M. H. Woods, “Alpha-Particle-Induced Soft Errors in Dynamic Memories,” IEEE Trans. Electron Devices, vol. 26, no. 1, pp. 2–9, 1979, doi: 10.1109/T-ED.1979.19370.
パッケージに含まれる残留放射性元素がアルファ崩壊したときに放射されるアルファ線が集積回路に突入して生じるソフトエラー.不具合として「システムノイズ」「最低動作電圧」「センスアンプ」「特定パターン依存」など候補があったが,この論文によって放射性粒子起因の誤動作というのが新しい候補になった(?).「ソフトエラー」という一過性の胡椒や「クリティカルチャージ」という集積回路が"0","1"を反転するのに必要な電荷量の差などが定義された論文みたい.

・コンデンサ関係 (23/02/11追記)
第四級アンモニウム塩を利用したコンデンサが液漏れを起こし電解液が基盤や基板上の部品を腐食させる事故が一時期多発していた.Wikipediaの記事にもなっている.

NEC Tokin のプロートライザが使用中に劣化するらしく,デカップリング容量として採用したノートパソコンの死亡例が一時期よく観察された.腕に自信のある人はプロートライザを剥がしてタンタルコンデンサに入れ替えるらしいが...

タンタルコンデンサは小さい逆電圧でも電流が流れる上,短絡モードで故障するので,使い方にはかなり気をつけないといけない.交流や電源電圧・電流がグラグラ動く箇所のデカップリングコンデンサとして使うと壊れる可能性があります.テクトロはタンタルコンデンサが好きなのか,燃えて壊れた報告がいくつか[1][2]あります.

2022年6月3日金曜日

インターンシップの思い出

唐突に,1x年前の学部時代のインターンシップの事を思い出したので書いてみる.もう時効だよね.当時まだ赤かった頃です.

・統合して4年経つのに旧M,旧Hと言う言葉が普通に使われる.福利厚生も違うという噂.
・技術者数に対してCADのライセンスが全く足りない.そのため技術者はライセンスサーバーをポーリングするスクリプトを書いて,ライセンスを取れたら仕事をするという感じだった.
・上記のため,回路設計のためのシミュレータ(Cadence ncverilog)がほとんど使えない.仕方が無いので別のマイナーメーカーの設計ツールを利用していた(Novas debussy).手持ちのノートPCにインストールした Veritak の方が便利だった始末.
→ debussy は使えると便利で,後継(?)の Veridi をたまに利用するようになった.
・前年度落選したベンダーが翌年営業攻勢をかけるため使えるCADが年度ごとに変わる.当時は意味を理解していなかったが,今思うと毎年習熟すべき CAD が変わるとか習熟コストを考えると非効率的すぎるのでは.
・技術者は忙しいのか,メンターさん含めてあまりこまめに見てもらえなかった.朝から晩まで会議だったり.派遣の方が一番優しかった気がする.これは部署や時期にもよるだろう.
・いっぽうでたばこ休憩が多かった.
・食堂がキツキツなうえにとにかくご飯がおいしくなかった.
・昼休憩後のトイレの個室が空いているところを見たことがない.寝てる?
・寮の食堂が量は多いわおいしいわで天国だった.お風呂も広かった.
・8時出社して20時帰寮して22時ぐらいまで試行錯誤していた.

3週間かけてI2Cの仕様書を理解してバスマスタ・スレーブのRTLを書く課題で,半泣きだったけれどステートマシンの理解がきちんとできたのでそういう意味では大変よかった.大学院生向けの課題だと聞いて後で泣いた.ここには絶対就職しないとも思った.事業所はなくなった.
青くなった今はよくなっていると思います,たぶん.