背景イメージ・デザイン
Penny Gunterman2020年6月29日

回復につながるデータの取得

去年はたくさんのことを学びました。あるがままで素晴らしい人がそこらじゅうにいることを知りました。感謝すべきたくさんのことがあることを知りました。人は良いことも、悪いことも、それ以外の多くのことに耐えられることを知りました。そして、こうしたことのすべてが、私が白血病であることを知ったときから始まりました。面倒くさがらなければ、誰もが学びに参加できます。白血病のレッスンにようこそ。

血液がんの化学療法は、他の化学療法による発見の多くの恩恵を受けていますが、少しひねりがあります。化学療法により、造血の仕組みが正常に働かなくなります。化学療法剤を使うと、赤血球(酸素を運ぶ)や血小板(出血時に凝固を助ける)、白血球(集団で感染症に対抗する)、免疫系に関連する主要細胞である、好中球と呼ばれる重要な細胞サブセットといった主要な血液細胞を体内でつくることができなくなります。免疫システムは明らかにゼロになるまで働きが低下します。UCLA血液がん病棟でシャワーが許可されないほど感染しやすい状態です。シャワーの水にエアロゾル化した病原体が存在する可能性があります。医療スタッフがお風呂の準備をして、消毒液を入れるのを待った後に入浴できます。通常の歯ブラシは禁止です。血小板値は通常の10分の1ですから、歯ブラシは出血するリスクがあり、通常の口腔細菌でも血液感染症につながる可能性があります(私の場合は2回ありました)。なので、普段の健康習慣が健康リスクになるときは、しばらくの間、病院に隔離されることになります。

私は化学療法を4回受け、その都度、1ヶ月の間病院に隔離されることになりました。12歳未満の子供の出入りは禁止、病棟を離れることも禁止、新鮮な果物や野菜も禁止(表面に細菌が付着している可能性あり)、マスクなしで部屋から出歩くことも禁止です。毎朝採血があって測定値が記録され、赤血や血小板の輸血が必要かどうかが判定され、退院するまで、白血球数/好中球数の経過が観察されます。発熱の有無を確認するために、4時間おきに体温が測定されます。免疫システムが働いていないとき、危険の兆候を示すのは最初から最後まで発熱です。体温が100.4Fを超えるとすぐに、血液培養、胸部X線検査、抗生物質の投与が始まります。これらは2時間以内に始めなければならず、入院中ずっと続きます。

こういうときは、ただ結果を待つだけ…それしかできません。血球数、グラフ上の数値、データ。わたしは、病院であまりすることもなく身動きもとれずにいるエンジニアです。そのうち間違いなくExcelシートが出てきます。

penny1

医師から情報を得ようとした経験があれば、どうなるかお分かりでしょう。医師は「人によって違う」、「正確に言うのは難しい」と、当たり前のことを口にします。最初の化学療法サイクルでは、ほかに情報がなく、医師が繰り返す言葉を信頼しました。「血小板は最後に回復する」、「好中球はすぐに回復するはず」。結局、どちらも間違っていることが分かりました。私の場合、先に血小板がたちどころに回復しました。後に説明されてなかったことに気付きましたが、回復期間は、2週間ではなく4週間でした。

以降、化学療法ラウンドを繰り返すたびに、データは増えていきました。人間の脳はパターン認識に優れています。また、自分の兆候も分かり始めます。血圧の上昇は通常、発熱に相関しています。冷暖房システムが過剰に働く午後2時を除いて寒気を感じ始めたら、その後1~2時間ほどで発熱する可能性が高くなります。過去のデータからすると48~72時間の間に発熱するはず、と伝えたとき、私の担当医は私の話を信じていませんでした。主治医は疑うような面持ちで「そうですか、すごいですね」と言いました。48時間後?そして私の予測通りに、発熱がありました。これで形勢逆転です。医師は、血球数が増えるタイミングや退院期間について、私の予測を尋ねてくるようになりました。私は、スプレッドシートで主な事象にフラグを立て、どの薬剤をどのぐらいの期間服用していたかという情報を看護師よりも早く引き出せるようになりました。

penny2

OSIsoftは、産業事業者向けのデータソフトウェアを作成しています。私たちは「アセットからのささやき」のことをいつも耳にします。アセットやプロセスが自分の手の中にあると感じられるほどの知識を持っている人は、うなり音が少しおかしいこと、あるいは指示値に揺らぎがあることの気付きから、機器の故障が差し迫っていることを予測できます。そのことに私は感心するばかりです。今では、人間の頭脳に追いつくにはビッグデータやその種の類いのあらゆるイニシアチブをどれほど進歩させなければならないのか、さらに深く理解しています。

課題は、総計値と個別値のギャップを埋めることです。長いこと隔離されていた時間(世界の他の地域も隔離される前)に、私は科学論文に目を通しました。しかし、自分自身に医療データを適用することは難しいことでした。これらの患者はどのぐらい自分と似ているのか?年齢は?私と同じ遺伝子変異があったのか?どんな化学療法剤が使われたのか?骨髄の回復に同様の時間がかかったか?

産業事業者は、アセットの問題を特徴付けて予測しようとするとき同様の課題に直面します。重要なデータは複数のシステムに散らばっており、必ずしも同一条件で比較を行えるほどのメタデータはありません。他のユニットも同様の気象条件で稼働していたのか?負荷は?時系列データは、時間の経過と共に予想されるベースラインの劣化のオーバーレイに利用できるのか?代表的なモデルを作るには、ビッグデータだけでは不十分です。ビッグデータは「巨大」データでなければなりません。しかも、十分に整理された巨大データです。セグメント化後もトレーニングセットに十分な量のデータが残るほど巨大でなければなりません。一般に統計は何もないよりは絶対ましですが、一方で私はデータの分布と自分のパターン認識能力の隔たりを経験しました。誰もが独自のデータセットを構築し、高度なアルゴリズムの話題が業界誌にあふれる中、アセットからのささやきに対する予知とも言える知見は見落とされがちです。

いつか、私たちは関連する変数でデータセットををより詳しく分析して、信頼性の高いモデルを構築できるようになるでしょう。そんな日が必ず来ます。確かに、HIPAA規制により、医療情報の取り扱いはさらに厳しくなります。加えて、抽出が難しいタイプされたメモ形式で多くのメタデータが保存されています。ですが私は、広くデータ共有が進むことを切望しています。COVID禍の時代にあって、私たち自身に当てはまるリスク要因を理解しようとする中において、これは歓迎できることだからです。私たちは幸運な無症状グループに入るのでしょうか?それとも大打撃に備える必要があるのでしょうか??重工業の中の加工業や製造業の企業は確実に前進を続けており、機器ベンダーも参入してきています。IoTデバイスの台頭によってデータ収集コストは確実に低下していますが、当分は、引き続き統合と正規化に取り組まなければなりません。大量のデータと優れたタグ付け/コンテキスト、検証済みデータ(例えば病院や制御システムからなどのデータ)と非公式なデータ(例えば個人からなどのデータ)の両方を扱う手段が必要になります。ビッグデータとAIは目的を達成します。間違いありません。

その間も私は、寄せ集めのツールを利用し、正しい予測をもとに有益な情報の抽出に注力するエンジニアに賭け続けます。私の担当医がしていたように。

Penny Gunterman製品マーケティングマネージャー製品マーケティングマネージャーのPenny Guntermanは、PI Systemのユーザーが、最大限の価値を獲得できるように全力で取り組んでいます。OSIsoft入社前は、Lawrence BerkeleyとLos Alamos National Labsで燃料電池の研究を行っていました。UC Berkeley(カリフォルニア大学バークレー校)で化学工学博士号、Caltech(カリフォルニア工科大学)で化学工学と経営学の学士号を取得しています。
グラフィック・デザイン・エレメント

常にあなたのお役に立ちたい

当社は40年以上に渡り信頼できるデータを提供してきました。実際に、当社の最初の25社のお客様の内、24社のお客様が今でもなお、当社のプラットフォームを使い続けています。お手伝いできることがあれば、ぜひお知らせください。

©2021OSIsoft, LLC