จีโนม เป็นข้อมูลทางพันธุกรรมทั้งหมด หรือชุดของยีนที่สมบูรณ์ที่ดำเนินการโดยเซลล์หรือไวรัส รวมถึงข้อมูลลำดับดีเอ็นเอ ของโครโมโซมแต่ละตัว และออร์แกเนลล์ย่อยทั้งหมด เรื่องของฟังก์ชันเป็นฟังก์ชัน บทความนี้แบ่งออกเป็น 2 ส่วนส่วนใหญ่องค์ประกอบของจีโนม และวิธีการวิจัยเกี่ยวกับจีโนม รวมถึงการจัดลำดับ แม้ว่าจะมีไม่กี่ส่วนแต่เนื้อหา ของบทความนี้ก็ยาวมาก
องค์ประกอบของจีโนม จีโนม ของสิ่งมีชีวิต ประกอบด้วยโครโมโซมครบชุด มีโมเลกุลดีเอ็นเอ 2 สายในโครโมโซม ลำดับของนิวคลีโอไทด์ ในโมเลกุลดีเอ็นเอ ประกอบเป็นยีน และหน่วยโครงสร้างภายนอกยีนตามลำดับ จีโนมเดี่ยวของสิ่งมีชีวิต จำนวนโครโมโซมในเซลล์สืบพันธุ์ คือครึ่งหนึ่งของเซลล์ร่างกาย จึงเป็นสิ่งที่เรียกว่าเดี่ยว จำนวนรวมของดีเอ็นเอที่อยู่ในนั้น จะเรียกว่าค่าซี สิ่งมีชีวิตแต่ละตัวมีค่าซีเฉพาะของตัวเอง
แม้แต่ในสิ่งมีชีวิตประเภทเดียวกัน ขนาดของจีโนมของสปีชีส์ต่างกันมาก ในยูคาริโอตที่ต่ำกว่าบางตัว ค่าซีโดยทั่วไปจะเพิ่มขึ้น ตามวิวัฒนาการของสิ่งมีชีวิต ตัวอย่างเช่น ค่าซีของเวิร์มมีค่ามากกว่าสาหร่าย และค่าซีของสาหร่ายมีค่ามากกว่าแบคทีเรีย เนื่องจากสิ่งมีชีวิตที่ซับซ้อน ต้องการมากกว่า ยีนเพื่อควบคุมลักษณะ
อย่างไรก็ตาม ค่าซีของสัตว์เลื้อยคลาน และอีไคโนเดิร์มนั้น เกือบเท่ากับค่าของสัตว์เลี้ยงลูกด้วยนม และพืชดอกและสัตว์ครึ่งบกครึ่งน้ำ บางชนิดมีค่าซีที่มากกว่า ค่าของสัตว์เลี้ยงลูกด้วยนมมาก นี่คือความผิดปกติของค่าซีที่มีชื่อเสียง หรือที่เรียกว่าความขัดแย้งของค่าซี มักไม่สอดคล้องกับความซับซ้อน ของการวิวัฒนาการของเจิร์มไลน์ และขนาดของจีโนมทางชีววิทยา ไม่มีส่วนเกี่ยวข้องกับสถานะวิวัฒนาการของสิ่งมีชีวิต
อย่างไรก็ตาม ปริมาณดีเอ็นเอขั้นต่ำ ที่จำเป็นในการเข้าถึงสิ่งมีชีวิตแต่ละประเภท โดยพื้นฐานแล้ว สอดคล้องกับตำแหน่ง วิวัฒนาการของสิ่งมีชีวิต ยิ่งตำแหน่งวิวัฒนาการสูง โครงสร้างทางสัณฐานวิทยา ที่ซับซ้อนมากขึ้น และจีโนมขั้นต่ำยิ่งมีขนาดใหญ่ขึ้น โมเลกุลดีเอ็นเอของจีโนม สามารถจำแนกได้ จากมุมมองที่แตกต่างกัน
วิธีการจำแนกประเภทแรก สามารถแบ่งออกเป็นลำดับพันธุกรรม และลำดับที่ไม่ใช่ยีน ลำดับยีนหมายถึงลำดับดีเอ็นเอ ที่กำหนดโปรตีน หรือผลิตภัณฑ์อาร์เอ็นเอในจีโนม ปลายด้านหนึ่งคือโคดอน และปลายอีกด้านหนึ่ง คือโคดอนหยุด เมื่อลำดับ ดีเอ็นเอเริ่มต้นด้วย ATG เป็นโคดอนเริ่มต้น
ตามด้วยทริปเปิ้ลโคดอน แต่ไม่พบผลิตภัณฑ์โปรตีน ที่สอดคล้องกับลำดับนี้ ลำดับดีเอ็นเอนี้เรียกว่า open reading frame ในพันธุกรรม (ORF) โดยทั่วไป กรอบการอ่านแบบเปิด จะเทียบเท่ากับยีน แต่ผลิตภัณฑ์ยังไม่ถูกค้นพบ หรือยืนยัน ลำดับที่ไม่ใช่ยีน คือลำดับดีเอ็นเอทั้งหมดในจีโนม ยกเว้นยีน ส่วนใหญ่เป็นลำดับขั้นกลางระหว่าง 2 ยีน
ในวิธีการจำแนกประเภทที่สอง จีโนมดีเอ็นเอสามารถแบ่งออกเป็นลำดับการเข้ารหัส และลำดับที่ไม่เข้ารหัส ลำดับการเข้ารหัส คือลำดับดีเอ็นเอ ที่เข้ารหัสอาร์เอ็นเอและโปรตีน และลำดับที่ไม่เข้ารหัสทั้งหมด จะเรียกรวมกันว่า เป็นลำดับที่ไม่มีการเข้ารหัส ยีนประกอบด้วยอินตรอนเป็นลำดับการเข้ารหัส ที่ไม่ใช่โปรตีนภายในยีน
วิธีการจำแนกประเภท ที่สามสามารถแบ่งออกเป็นลำดับเดียว และลำดับซ้ำ ลำดับดีเอ็นเอที่ปรากฏเพียงครั้งเดียวในจีโนม เรียกว่าลำดับเดียวตัวอย่างเช่น ลำดับยีนส่วนใหญ่เป็นลำดับเดียว ลำดับซ้ำหมายถึงลำดับดีเอ็นเอ ที่ซ้ำกันในจีโนม บางส่วนกระจัดกระจาย และบางส่วนจัดกลุ่ม ตามความถี่ของการทำซ้ำ ลำดับการทำซ้ำ สามารถแบ่งออกเป็นลำดับการทำซ้ำเล็กน้อย
โดยทั่วไปมีเพียง 2 ถึง 10 สำเนาในจีโนมเดี่ยว และยีนโครงสร้างโดยทั่วไป อยู่ในหมวดหมู่นี้ บางครั้ง 2 ถึง 3 สำเนาสามารถถือเป็นลำดับเดียว ลำดับที่ซ้ำกันในระดับปานกลาง 10 ถึง 10,000 ซึ่งมักจะเป็นลำดับที่ไม่มีการเข้ารหัส แต่ยังรวมถึงไรโบโซมอล อาร์เอ็นเอ และทีอาร์เอ็นเอ และยีนโปรตีนโครงสร้างบางอย่าง เช่นยีนฮิสโตน ลำดับที่ซ้ำซ้อนสูง โดยพื้นฐานแล้วโปรคาริโอต ไม่มีลำดับที่ซ้ำซาก และลำดับที่ซ้ำกันในยูคาริโอต ครอบครองสัดส่วนที่มาก
บทความอื่นที่น่าสนใจ > ปีกมดลูกอักเสบ มีลักษณะอาการอย่างไร และการอักเสบของเนื้อเยื่อเกี่ยวพัน