wiki:StoryConvertGenoData

Version 11 (modified by Morris Swertz, 13 years ago) (diff)

--

As a admin I want to prepare geno data linked to pheno data

TracNav(MolgenisAppStories)?

Scrum: ticket:1052

How to demo:

  • Genotype data can be converted from TriTyper? into PLINK format
  • Genotype data is binary format (or binary format only?)
  • Genotype data is filtered for only the selected Individuals (2.5M snps, max 20k individuals, in practice ~5k individuals)
  • Genotype data is linked to phenotype data using the study specific pseudonyms (of Individuals)

Question

  • Can Harm-Jan provide us data in PLINK format?
  • in BIM format genotype data, phenotype data selection is seperate use case.

Pre-condition

  • Marcel spreadsheet bevat LLPatient ID's en Marcel Pseudoniemen (gekoppeld).
  • Genotype data is in TriTyper? format (???)
  • Voor onderzoek wordt LL bronpseudoniem vervangen door onderzoekpseudoniem.

Acceptance criteria

  • Er is een lijst met onderzoekspseudoniem en Marcelpseudoniem (alleen voor de geselecteerde individuen!)
  • Lijst gaat mee in data export/import naar CIT Publish (tijdelijk)
  • Convertor leest TriTyper? format file, filtert op individuen, en schrijft weg naar PLINK met onderzoekspseudoniem