BIPROGY Foresight in sight BIPROGY Foresight in sight

データエンジニアリング II

技報サイト内検索

データエンジニアリング II

企業情報システムとデータの活用範囲の拡大

山崎 慎一

企業のあらゆる業務にコンピュータが活用されている。企業が自社の業務プロセスから生まれるデータを蓄積して、ビジネス課題の解決やビジネス戦略に活用するためのデータウェアハウスを構築するのは普通になり、経営を支援するためのビジネス・インテリジェンスという用語は一般的になっている。データ活用を企業の重要戦略活動とするイノベーターは、従来からのデータ分析に加えて、これまで対象としてこなかったビッグデータを活用し、新たなビジネスに利用するようになっている。多くの企業がこれに続くようにビッグデータの活用に注目し、利用しようとする大きな動きがある。ビッグデータの活用がイノベーターからマジョリティに移ろうとしている。 本稿では、企業のデータ分析の必要性、分析対象のデータ、分析の技術などを明らかにする。さらに、分析を必要とする企業に対してITサービス企業が提供すべきサービスを明らかにする。

ダウンロード【PDF】(525.2 KB)別ウィンドウで開く

顧客管理システム再構築におけるデータモデルパターン“Party Model”の活用

羽生 貴史

企業情報システムを再構築し、異なるシステム間で情報をやりとりできるようにするには、システム間で保有されているデータの「意味」を相互に理解可能となるよう、概念データモデルを共通化することが重要になる。 ある顧客管理システム再構築検討プロジェクトにおいて、顧客データを共通化して企業内の他システムでも利用できるようにすべく、実験的に「Party Model」を活用した顧客データモデルを作成した。その結果、Party Modelを活用した顧客データモデルは顧客データをさまざまな切り口から見ることができ、企業内の情報システム間共通の顧客データモデルとして適していることが分かった。 Party Modelなどのデータモデルパターンは汎用性を意識したものであり、顧客管理以外の他の業務分野の共通データモデルを作成する場合にも活用することを検討すべきである。

ダウンロード【PDF】(717.9 KB)別ウィンドウで開く

PostgreSQLを活用した仮想データ統合基盤の実現

中山 陽太郎

企業においてデータ統合に対する要求が高まっている一方で、既存業務システムの一部のデータベースは存続させたい場合や、段階的なシステム移行にともないデータを部分的に統合したい場合など、全面的なデータの物理統合では解決できないケースが生じている。既存データベースの統合と既存データベースを継続して運用したいという要求に対して、物理的なデータ統合によらず仮想データ統合を適用することで、統合DBと既存DBの共存を実現することが可能となる。 2010年12月に構築した仮想データ統合基盤では、対象とする複数の既存データベースを変更せず仮想的に統合し、一元的なデータベースにすることが可能である。仮想データ統合基盤として、オープンソースのRDBMSであるPostgreSQLの外部データ管理機能を用いてPostgreSQLの連邦型データベースシステム(PostgreSQL Federation Database System:PGFDBS)を開発した。また、分散問合せの最適化を改善することで、Oracle、SQLServerを論理的に統合し、異種RDBに対する問合せが効率的に実行されることを確認した。本稿では、連邦データベースシステムPGFDBSの実証検証について報告する

ダウンロード【PDF】(524.2 KB)別ウィンドウで開く

データベース統合におけるセキュリティ対策

八津川 直伸

一般的に企業の情報システムでは、部門毎に独自のデータを管理するなど、マスターデータが複数存在する状態に陥っている。企業経営の観点からはROI(Return On Investment)改善のため、マスターデータを統合し、同時にセキュリティ管理を充実したいという動機がある。一方、サイバー攻撃など外部からの不正アクセスや内部犯罪による情報漏洩事故が頻発している。攻撃技術と対策技術はイタチごっこであるため、企業システム防衛にあたっては、新たな方法による攻撃を受けても被害を最小限に抑える仕組みを備えることが肝要である。 特にデータベース統合の局面では、異なるセキュリティ機能やセキュリティポリシーを持つ個別データベースを統合するため、統合データベース全体としてのセキュリティを如何に維持するかが課題となる。 本稿ではまず、世の中の基準やガイドラインに照らし、望まれ得る一般的なデータベースのセキュリティ要件を述べ、さらに仮想的データベース統合に特有なセキュリティ要件を整理した。これらをデータベース統合の際のセキュリティ要件策定に適用することにより、不正アクセスや、内部犯罪、誤操作に起因する機密情報や個人情報の漏洩・破壊、ならびに障害、災害による企業情報の損壊・滅失による業務継続不能といったセキュリティ上の脅威やリスクを低減できる。

ダウンロード【PDF】(3.1 MB)別ウィンドウで開く

大量かつ複雑な非構造化データを扱う解析基盤の仕組み

星野 隆之

2011年より、ゲノムコホート研究のためのデータ解析基盤の設計およびプロトタイプシステム構築を行い、データ解析基盤を整理した。 ゲノムコホート研究は、集団を対象に追跡調査を行って、遺伝子と病気の発症などとの関係を探ることを目的とした研究で、診療情報、健康診断情報、ゲノム情報など、様々な情報を、長期間、収集・蓄積し、解析する。今回のデータ解析基盤は、このような研究活動を支援するもので、大量・非構造化データの扱い、個人情報の扱い、個人の識別などの課題を解決した。 ゲノムコホート研究におけるデータの扱いは、大量かつ複雑な非構造化データを扱う事例として参考になるものであり、この活動で得られたアーキテクチャは、疫学研究向けに留まらず、データを解析しその結果を事業に活用するための仕組みづくりに有効である。

ダウンロード【PDF】(454.5 KB)別ウィンドウで開く

医療システムでの非構造化データ活用事例

沖 俊吾

複数の医療機関の診療データや健診機関の健診データを数十年に渡り蓄積し、疫学研究用にデータを提供する疫学データベースシステムを構築した。本プロジェクトを遂行するにあたり、基盤機能として低コスト、大量データの格納(拡張性を含む)、個人情報保護の要件を満たす必要があった。 低コストと大量データの格納の両立は、OSS(オープンソースソフトウェア)のKey-Valueストア型分散データベース製品であるCassandraを核に、並列分散処理基盤製品のHadoop や全文検索エンジンのSolrを組み合わせて実現した。個人情報保護は、診療情報および健診情報と個人情報の分離(匿名化)、およびアクセス経路の制限により確立した。 本稿では、疫学データベースシステムの構築を通して、医療データの活用事例を紹介する。

ダウンロード【PDF】(1.3 MB)別ウィンドウで開く

検索技術による企業内外データの仮想統合

石井 愛

検索技術により、企業内外に散在するデータを仮想的に統合する「情報アクセス基盤」と、その上でデータを分析・活用するアプリケーション(Search Based Application:SBA)が注目を集めはじめている。SBAは意思決定や、マーケティング、リコールの予兆の検知等、複雑な要求に応えるアプリケーションである。 本論文では、オープンソースの検索エンジンであるApache Solrをはじめとした複数のOSSを活用して情報アクセス基盤を構築する意義と、構築にあたっての留意点を、SBAの構築事例を踏まえて報告する。

ダウンロード【PDF】(1.4 MB)別ウィンドウで開く

業務仕様の変化に強いプログラム作成を目指したビジネスロジック・ジェネレータ

山本 史朗

2012年に入り、ビジネスライフサイクルの短縮傾向、顧客のIT投資の冷え込み、システム開発期間の短縮、さらなるコスト圧縮などの外部要因の変化により、システム開発ベンダには、これまで以上の短期開発・低コスト開発が求められている。それに応えるためには、さらなる開発生産性向上への取り組みが必要だが、業務アプリケーションを開発する上で、業務仕様の一致確認作業(単体、機能テスト)や仕様の曖昧さからの手戻り作業が大きな割合を割いている。特に複雑な業務仕様は、仕様確定の漏れや変更を誘発することが多く、開発生産性を向上する上で大きな課題となっている。業務仕様である機能やデータモデルの変更に強い「自動化」手法を用いることで、初期開発時だけでなく、保守フェーズでの作業効率の改善も期待できる。本稿では、日本ユニシスが開発した「自動化」ツールであるビジネスロジック・ジェネレータの概要と機能を紹介し、プロトタイピング事例を踏まえ、業務仕様の変更に強いプログラム作成の試みとして「自動化」手法の有用性について述べる。

ダウンロード【PDF】(1.2 MB)別ウィンドウで開く

情報システムの変容とデータベース管理の未来

原 潔

ビジネスの変化に対応するために情報システムを俊敏に変化させる課題の中心を、データベースの統合の課題とみる。データベース管理システムの原理、歴史的背景の復習をもとに、情報システムの複雑さをデータベース管理の面から整理する。データベースの未来環境としてのデータベース統合の世界を描き、変化対応力を持った情報システムを実現するために、「ドメインデータモデル」が重要であることを主張する。

ダウンロード【PDF】(451.7 KB)別ウィンドウで開く