附 录

(一)附图

图 S1 qGSEA 的界面,图中显示的是选择运行模式的界面

图 S2 qGSEA 的错误提示消息

A. 未输入 GSE accession 时的提示消息。B. 未选择 matrix 文件时的提示消息。C. 选择了错误的 matrix 文件时的提示消息。D. 未选择 SOFT 文件时的提示消息。E. 选择了错误的 SOFT 文件时的提示消息。E. 输入了错误的 HUGO 基因符号(只有一个基因)时的提示消息。F. 输入了错误的 HUGO 基因符号(有多个基因)时的提示消息。

图 S3 h 集合中其它基因集的重合分析,与图7形成对照

A. PI3K_AKT_MTOR_SIGNALING(上)和 TNFA_SIGNALING_VIA_NFKB(上),作为 MTORC1_SIGNALING 的对照。B. UV_RESPONSE_UP(上)和UV_RESPONSE_DN(下),作为 DNA_REPAIR 的对照。C. PROTEIN_SECRETION(上)和 APOPTOSIS(下),作为 UNFOLDED_PROTEIN_RESPONSE 的对照。基因集名称均省略前缀 HALLMARK_

图 S4 在 javaGSEA 中制作表型文件

A. 离散型表型。B. 先折叠数据集,然后以特定基因的表达量作为表型,图中演示了搜索基因符号的功能(这里是部分匹配)。

(二)附表

表 S1 在全部集合中 n 值排名前25的基因集
集合 基因集 N n
c1 CHR12Q24 102 35
c2.cgp HASLINGER_B_CLL_WITH_CHROMOSOME_12_TRISOMY 89 33
c3.tft E2F_Q3_01 72 30
c2.cgp LI_WILMS_TUMOR_VS_FETAL_KIDNEY_1_DN 85 29
c2.cgp TOYOTA_TARGETS_OF_MIR34B_AND_MIR34C 86 29
c3.tft E2F_Q4_01 72 29
c2.cgp FOURNIER_ACINAR_DEVELOPMENT_LATE_2 81 28
c3.tft E2F_Q4 73 28
c3.tft E2F1_Q6 74 28
c3.tft E2F1_Q4 71 28
c5 GO_NUCLEAR_ENVELOPE_ORGANIZATION 86 27
c2.cgp NIKOLSKY_BREAST_CANCER_12Q24_AMPLICON 66 27
c2.cgp ZHANG_TLX_TARGETS_36HR_DN 85 27
c2.cgp MITSIADES_RESPONSE_TO_APLIDIN_DN 88 27
c3.tft E2F1_Q6_01 75 27
c3.tft E2F1_Q4_01 71 27
c5 GO_NUCLEAR_PORE 84 27
c2.cgp MORI_IMMATURE_B_LYMPHOCYTE_DN 88 27
c6.all RB_P107_DN.V1_UP 76 27
c3.tft E2F_Q3 77 27
c2.cgp PUJANA_XPRSS_INT_NETWORK 86 27
c3.tft E2F4DP2_01 74 27
c2.cgp PUJANA_BRCA_CENTERED_NETWORK 81 27
c3.tft E2F1_Q3 72 27
c5 GO_REGULATION_OF_MICROTUBULE_POLYMERIZATION_OR_DEPOLYMERIZATION 85 26
表 S2 集合c1、c3.tft和h中 n 值排名最靠前的基因集
集合 基因集 N n
c1 CHR12Q24 102 36
c1 CHR12Q23 91 11
h HALLMARK_MITOTIC_SPINDLE 71 25
h HALLMARK_G2M_CHECKPOINT 76 24
h HALLMARK_E2F_TARGETS 71 23
h HALLMARK_MYC_TARGETS_V1 67 22
h HALLMARK_MYC_TARGETS_V2 73 19
h HALLMARK_MTORC1_SIGNALING 62 15
h HALLMARK_DNA_REPAIR 65 14
h HALLMARK_UNFOLDED_PROTEIN_RESPONSE 64 13
c3.tft E2F_Q3_01 72 30
c3.tft E2F_Q4_01 72 29
c3.tft E2F_Q4 73 28
c3.tft E2F1_Q6 74 28
c3.tft E2F1_Q4 71 28
c3.tft E2F1_Q6_01 75 27
c3.tft E2F1_Q4_01 71 27
c3.tft E2F_Q3 77 27
c3.tft E2F4DP2_01 74 27
c3.tft E2F1_Q3 72 27
表 S3 核心基因集完整列表
集合 基因集 N n
h HALLMARK_MITOTIC_SPINDLE 71 25
h HALLMARK_G2M_CHECKPOINT 76 24
h HALLMARK_E2F_TARGETS 71 23
h HALLMARK_MYC_TARGETS_V1 67 22
h HALLMARK_MYC_TARGETS_V2 73 19
c1 CHR12Q24 102 36
c2.cgp HASLINGER_B_CLL_WITH_CHROMOSOME_12_TRISOMY 89 33
c2.cgp LI_WILMS_TUMOR_VS_FETAL_KIDNEY_1_DN 85 30
c2.cgp TOYOTA_TARGETS_OF_MIR34B_AND_MIR34C 86 30
c2.cp.biocarta BIOCARTA_G1_PATHWAY 79 23
c2.cp.biocarta BIOCARTA_G2_PATHWAY 79 22
c2.cp.biocarta BIOCARTA_MCM_PATHWAY 79 20
c2.cp.kegg KEGG_CELL_CYCLE 87 24
c2.cp.reactome REACTOME_TRANSPORT_OF_MATURE_TRANSCRIPT_TO_CYTOPLASM 72 15
c3.tft E2F_Q3_01 72 30
c4.cm MODULE_98 75 24
c4.cm MODULE_198 76 24
c5 GO_NUCLEAR_ENVELOPE_ORGANIZATION 86 28
c5 GO_NUCLEAR_PORE 84 28
c6 RB_P107_DN.V1_UP 76 28
表 S4 用于支持 LEM4 已知的功能的补充基因集(编号与表2中的相对应)
集合 基因集 N n
(2)调控细胞周期蛋白D-CDK4/6-Rb轴
c6.all E2F1_UP.V1_UP 78 23
(3)调控ERα信号通路
c6.all MYC_UP.V1_UP 67 14