2024年5月の振り返り 見出しへのリンク

概要 見出しへのリンク

  • IMCコンペに参加していた
  • LT会を開催して、最近のpythonについて発表した

振り返り 見出しへのリンク

やったこと 見出しへのリンク

  • IMC2024コンペ

    • Cuda OOMのデバッグ
    • 方針の転換
    • 高速化
  • 社内でLT会を開催した

    • python3.9 ~ 3.12までの機能について調べた
    • 開発環境周りのツールについて調べた
    • python3.9 ~ 3.12までの機能や開発環境周りのツールについてまとめたものは別postにした
  • 社内の勉強会の4,5回目を開催した

    • 4回目: ソフトウェアアーキテクチャの基礎 第3章 p49 ~ 第4章 p66
    • 5回目: ソフトウェアアーキテクチャの基礎 第5章 アーキテクチャ特性を明らかにする, p67 ~ p78
  • 本を読んだ

    • 推薦システム 統計的機械学習の理論と実践
      • 第8章まで
    • 推薦システム実践入門 仕事で使える導入ガイド
      • 一通り一周
    • MACHINE LEARNING SYSTEM DESIGN INTERVIEW
      • 一通り一周
    • 例題で学ぶグラフ理論
      • 第5章、第6章
    • 採用基準
      • 一通り読み返した

わかったこと 見出しへのリンク

  • IMC2024

    • サブした時は、Cuda OOMはNotebook Threw Exceptionに丸められる
    • 他には、CPU側のOOMはそのまま、Timeoutもそのまま出力される
    • サブしてエラーが起きる時は、学習データを使ってNotebook上で走らせてデバッグする
    • 実験はベースラインから1要素ずつ確かめていく(n回目)
      • cv/public両方確かめる
      • cvだけ信じてある程度作ってから相関しなかった時辛い(辛い)
    • ソロでも、逐一ログに残してやるとちょっとした改善が可視化できてモチベが続きやすい
  • 粗い粒度での論理のチェックか細かい粒度での実装の中身のチェックかを分けるといい

    • 粗い粒度でのチェックにはロジックツリーとか作って可視化するといい
    • 実装のチェックは事前にどういうことを実装したかったのか意図を可視化してからする
      • 実装のチェックを漫然と始めるとバグに気づきにくくなる
  • 新しい実装する前には、既存実装についてよく整理する

  • 人を巻き込む時は、背景や目的をドキュメントにちゃんと残す

  • ちょっとしつこいくらいに告知する

  • 参加するハードルを下げる

  • モヤモヤすることも言語化して文章に残すとコトかできるので課題として整理できる

  • MACHINE LEARNING SYSTEM DESIGN INTERVIEWは推薦の事例が多いけどいい本だった

  • 推薦システム実践入門 仕事で使える導入ガイドは全体感を把握するのにかなりわかりやすくてよかった

来月にやること 見出しへのリンク

  • 勉強会の6回目,7回目の運営
  • LT会2回目の運営
  • IMC2024の復習
  • 次のコンペに参加する
  • 本を読む
    • INSPIERED
    • Lean Analytics
    • 達人に学ぶSQL徹底指南書第2版
    • Human-in-the-Loop 機械学習

Input 見出しへのリンク