2023-09-01から1ヶ月間の記事一覧

第2目標:TCGA dataからNormal Tumorの情報を分割してDEGを取得する。(行動1 : tumorとnormalを分割したデータを作成する)

前回、目標1において作成したTCGA-BRCAのデータには、末尾に-01, -06,-11の3種類のデータがありそうなことが分かりました。TCGAデータには、TumorとNormalがあることが分かっているので、それぞれが何を意味しているのかGDC portal GDC にいっていくつかの情…

今後にやっていきたいこと(随時更新予定)

今後やっていきたい目標 ① TCGAに含まれる正常組織との区別をどうするか: >目標2:行動1で解決済み biologist-programming-training.hatenablog.com ② TPMデータを用いてDEGを算出する to adjacenyt normal tissue : >DEGを求める手法を学習し(特性を理解し)…

第1目標:TCGA dataの各癌腫ごとのTPMデータの取得 (行動3:ある特定の癌腫のsubjectデータの抽出)

前回、行動2の中で今回のデータは行列に以下の情報が格納されていることが分かりました。 ・行:各geneの情報 ・列:subjectの情報 行動3 : 特定の癌種のsubjectデータの抽出(例. Breast Cancer/BRCAを抽出) それでは、目的の癌種の情報を抽出するためには、…

Rのデータ型とデータ構造の種類について

TCGAデータの読み込みに際して、class() functionを使用した際に、いくつかのデータ構造が出てきました。 それぞれ、どのような性質があるのかまとめておきたいと思います。 データ型 Rにおけるデータ型にはいくつかあるようですが、直近は関係ありそうなも…

第1目標:TCGA dataの各癌腫ごとのTPMデータの取得 (行動2:ディレクトリの設定、packageのinstallと呼び出し、データの読み込みと構造の理解)

それでは、ここからはダウロードしたデータ ("tcga_RSEM_gene_tpm.gz")を使用して、ある癌腫のデータの抽出に進みたいと思いますが、今日はファイルの格納場所を設定し、ファイルを読み込む方法を記載したいと思います。 行動2 データを読み込み、構造を理解…

間話 : 今後解析に使用するPCの性能とRのversion情報 (参考URL含む)

今後、解析を進めていくうえで新たに購入したPCがどこで時間がかかるのかを含めて記録するためにPCの性能、Rプログラムのversion情報などをメモしていこうと思います。が、何の情報を書いたらよいかわからないので、とりあえず、 メーカー : hp モデル :HP …

第1目標:TCGA dataの各癌腫ごとのTPMデータの取得 (行動1:TCGAデータの取得)

まず、1つ目の目標として、がん領域において非常に重要なTCGAデータのダウンロードと、その中身の確認方法を検討していきたいと思います。 それでは、1つめの目標をまずタイトルの通りに「TCGA dataの各癌腫ごとのTPMデータの取得」と設定することにします。…

初投稿-このブログの目的と自己紹介-

はじめまして。バイオロジストです。 このブログは、プログラミングをかじってもすぐにあきらめ、忘れるを繰り返す意志薄弱なバイオロジストがどうにか一歩ずつ、公共データを解析することを目指す自分用の備忘録として書いていこうと思っています。上記の通…