ES2382542T3 - Polynucleotides for use as labels and tag complements, manufacture and use thereof - Google Patents

Polynucleotides for use as labels and tag complements, manufacture and use thereof Download PDF

Info

Publication number
ES2382542T3
ES2382542T3 ES02709941T ES02709941T ES2382542T3 ES 2382542 T3 ES2382542 T3 ES 2382542T3 ES 02709941 T ES02709941 T ES 02709941T ES 02709941 T ES02709941 T ES 02709941T ES 2382542 T3 ES2382542 T3 ES 2382542T3
Authority
ES
Spain
Prior art keywords
label
oligonucleotide
complement
complements
hybridization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02709941T
Other languages
Spanish (es)
Inventor
Daniel Kobler
Daniel Fieldhouse
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Luminex Molecular Diagnostics Inc
Original Assignee
Luminex Molecular Diagnostics Inc
TM Bioscience Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Luminex Molecular Diagnostics Inc, TM Bioscience Corp filed Critical Luminex Molecular Diagnostics Inc
Application granted granted Critical
Publication of ES2382542T3 publication Critical patent/ES2382542T3/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Detergent Compositions (AREA)

Abstract

A family of minimally cross-hybridizing nucleotide sequences, methods of use, etc. A specific family of 1168 24mers is described.

Description

Polinucleótidos para su utilización como etiquetas y complementos de etiqueta, fabricación y utilización de los mismos. Polynucleotides for use as labels and tag complements, manufacture and use thereof.

Campo de la invención Field of the Invention

La presente invención se refiere a familias de etiquetas de oligonucleótido para su utilización, por ejemplo, en la clasificación de moléculas. Los miembros de una familia dada de etiquetas pueden distinguirse entre sí mediante hibridación específica con sus complementos de etiqueta. The present invention relates to families of oligonucleotide tags for use, for example, in the classification of molecules. Members of a given family of tags can be distinguished from each other by specific hybridization with their tag add-ons.

Antecedentes de la invención Background of the invention

La hibridación específica de oligonucleótidos y sus análogos es un procedimiento fundamental que se emplea en una amplia variedad de aplicaciones de investigación, médicas e industriales, incluyendo la identificación de polinucleótidos relacionados con enfermedades en ensayos de diagnóstico, examen para seleccionar clones de polinucleótidos diana novedosos, identificación de polinucleótidos específicos en transferencias de mezclas de polinucleótidos, bloqueo terapéutico de genes expresados de manera inapropiada y secuenciación de ADN. La hibridación específica de secuencia es crítica en el desarrollo de ensayos de ácidos nucleicos multiplexados de alto rendimiento. A medida que los formatos para estos ensayos se expanden para abarcar cantidades mayores de información de secuencia adquirida mediante proyectos tales como el proyecto del genoma humano, el desafío de la hibridación específica de secuencia con alta fidelidad se vuelve cada vez más difícil de lograr. Specific hybridization of oligonucleotides and their analogs is a fundamental procedure that is used in a wide variety of medical and industrial research applications, including the identification of disease-related polynucleotides in diagnostic assays, examination to select novel target polynucleotide clones, identification of specific polynucleotides in transfers of polynucleotide mixtures, therapeutic blocking of inappropriately expressed genes and DNA sequencing. Sequence-specific hybridization is critical in the development of high performance multiplexed nucleic acid assays. As the formats for these assays expand to cover larger amounts of sequence information acquired through projects such as the human genome project, the challenge of sequence-specific hybridization with high fidelity becomes increasingly difficult to achieve.

En gran parte, el éxito de la hibridación utilizando oligonucleótidos depende de minimizar el número de falsos positivos y falsos negativos. Tales problemas han hecho que sea muy difícil la utilización simultánea de múltiples sondas de hibridación en un único experimento, es decir el multiplexado, particularmente en el análisis de múltiples secuencias génicas en un microalineamiento génico. Por ejemplo, en determinados ensayos de unión, se unen varias moléculas de ácido nucleico a un chip con el deseo de que una secuencia “diana” dada se una selectivamente a su complemento unido al chip. Se han desarrollado enfoques que implican la utilización de etiquetas de oligonucleótido unidas a un soporte sólido que pueden utilizarse para hibridarse específicamente a los complementos de etiqueta que se acoplan a secuencias sonda. Chetverin et al. (documento WO 93/17126) utilizan alineamientos de oligonucleótidos binarios, seccionados, para clasificar y analizar ácidos nucleicos. Estos alineamientos presentan una secuencia de nucleótidos constante unida a una secuencia de nucleótidos variable adyacente, ambas unidas a un soporte sólido mediante un resto de unión covalente. Estos alineamientos binarios presentan ventajas en comparación con alineamientos habituales porque pueden utilizarse para clasificar cadenas según sus secuencias terminales de manera que cada cadena se une a una ubicación fija en un alineamiento. El diseño de las secuencias terminales en este enfoque comprende la utilización de secuencias constantes y variables. Las patentes estadounidenses US nº 6.103.463 y nº 6.322.971 concedidas a Chetverin et al. el 15 de agosto de 2000 y el 27 de noviembre de 2001, respectivamente. In large part, the success of hybridization using oligonucleotides depends on minimizing the number of false positives and false negatives. Such problems have made the simultaneous use of multiple hybridization probes very difficult in a single experiment, that is multiplexing, particularly in the analysis of multiple gene sequences in a gene microalignment. For example, in certain binding assays, several nucleic acid molecules are attached to a chip in the hope that a given "target" sequence selectively binds to its complement bound to the chip. Approaches have been developed that involve the use of oligonucleotide tags attached to a solid support that can be used to specifically hybridize to tag complements that couple to probe sequences. Chetverin et al. (WO 93/17126) use binary oligonucleotide alignments, sectioned, to classify and analyze nucleic acids. These alignments have a constant nucleotide sequence linked to an adjacent variable nucleotide sequence, both linked to a solid support by a covalent binding moiety. These binary alignments have advantages compared to usual alignments because they can be used to classify chains according to their terminal sequences so that each chain joins a fixed location in an alignment. The design of the terminal sequences in this approach includes the use of constant and variable sequences. U.S. Patent Nos. 6,103,463 and 6,322,971 issued to Chetverin et al. on August 15, 2000 and November 27, 2001, respectively.

Este concepto de utilizar etiquetas moleculares para clasificar una mezcla de moléculas es análogo a etiquetas moleculares desarrolladas para genética bacteriana y de levaduras (Hensel et al., Science; 269, 400-403: 1995 y Schoemaker et al., Nature Genetics; 14, 450-456: 1996). En este caso, se utiliza un procedimiento denominado mutagénesis “etiquetada con firma” en el que cada mutante se etiqueta con una secuencia de ADN diferente para recuperar genes mutantes de una mezcla compleja de aproximadamente 10.000 colonias bacterianas. En el enfoque de etiquetado de Barany et al. (documento WO 9731256), conocido como el “chip postal”, una familia de moléculas de ácido nucleico, las “direcciones de código postal”, cada una diferente de las otras, se exponen en una rejilla. Se unen moléculas diana a secuencias de oligonucleótido complementarias a las “direcciones de código postal”, denominadas “códigos postales”, que se utilizan para hibridarse específicamente a las locaciones de dirección en la rejilla. Aunque la selección de estas familias de secuencias de polinucleótido utilizadas como direcciones es crítica para un correcto rendimiento del ensayo, no se ha descrito el rendimiento. This concept of using molecular labels to classify a mixture of molecules is analogous to molecular labels developed for bacterial and yeast genetics (Hensel et al., Science; 269, 400-403: 1995 and Schoemaker et al., Nature Genetics; 14, 450-456: 1996). In this case, a procedure called "tagged" signature mutagenesis is used in which each mutant is labeled with a different DNA sequence to recover mutant genes from a complex mixture of approximately 10,000 bacterial colonies. In the labeling approach of Barany et al. (WO 9731256), known as the "postal chip", a family of nucleic acid molecules, the "postal code addresses", each different from the others, are displayed on a grid. Target molecules are attached to oligonucleotide sequences complementary to "postal code addresses", called "postal codes", which are used to specifically hybridize to address locations on the grid. Although the selection of these families of polynucleotide sequences used as addresses is critical for proper assay performance, the performance has not been described.

Trabajar en un entorno de hibridación altamente paralela que requiere hibridación específica impone muchos criterios de selección rigurosa para el diseño de familias de oligonucleótidos que van a utilizarse. El éxito de estos enfoques depende de la hibridación específica de una sonda y su complemento. Surgen problemas ya que la familia de moléculas de ácido nucleico se hibrida de manera cruzada o se hibrida incorrectamente con las secuencias diana. Aunque es común obtener una hibridación incorrecta que da como resultado falsos positivos o una incapacidad de formar híbridos que da como resultado falsos negativos, la frecuencia de tales resultados debe minimizarse. Para lograr este objetivo deben considerarse determinadas propiedades termodinámicas de formación de híbridos de ácido nucleico. La temperatura a la que los oligonucleótidos forman dúplex con sus secuencias complementarias conocida como la Tm (la temperatura a la que el 50% del dúplex de ácido nucleico está disociado) varía según varias propiedades dependientes de la secuencia incluyendo las energías de formación de puentes de hidrógeno de los pares convencionales A-T y G-C (reflejada en GC o composición de bases), energía libre de apilamiento y, en menor medida, las interacciones entre vecinos más próximos. Estas energías varían ampliamente entre oligonucleótidos que se utilizan normalmente en ensayos de hibridación. Por ejemplo, la hibridación de dos secuencias de sonda compuestas por 24 nucleótidos, una con un contenido en GC del 40% y la otra con un Working in a highly parallel hybridization environment that requires specific hybridization imposes many rigorous selection criteria for the design of oligonucleotide families to be used. The success of these approaches depends on the specific hybridization of a probe and its complement. Problems arise since the family of nucleic acid molecules cross-hybridize or incorrectly hybridize with the target sequences. Although it is common to obtain incorrect hybridization that results in false positives or an inability to form hybrids that results in false negatives, the frequency of such results should be minimized. To achieve this objective, certain thermodynamic properties of nucleic acid hybrid formation must be considered. The temperature at which the oligonucleotides form a duplex with their complementary sequences known as the Tm (the temperature at which 50% of the nucleic acid duplex is dissociated) varies according to several sequence dependent properties including bridging energies. hydrogen of the conventional AT and GC pairs (reflected in GC or base composition), stacking-free energy and, to a lesser extent, interactions between nearest neighbors. These energies vary widely between oligonucleotides that are normally used in hybridization assays. For example, the hybridization of two probe sequences composed of 24 nucleotides, one with a GC content of 40% and the other with a

contenido de GC del 60%, con su diana complementaria en condiciones convencionales puede presentar teóricamente una diferencia de 10ºC en la temperatura de fusión (Mueller et al., Current Protocols in Mol. Biol.; 15, 5:1993). Se producen problemas en la hibridación cuando se permite que se formen los híbridos en condiciones de hibridación que incluyen una única temperatura de hibridación que no es óptima para una hibridación correcta de todas las secuencias de oligonucleótido de un conjunto. Puede producirse hibridación de apareamiento erróneo de sondas no complementarias formando dúplex con una estabilidad de apareamiento erróneo medible (Santalucia et al., Biochemistry; 38: 3468-77, 1999). Puede producirse apareamiento erróneo de dúplex en un conjunto particular de oligonucleótidos en condiciones de hibridación en las que el apareamiento erróneo da como resultado una disminución de la estabilidad del dúplex que da como resultado una Tf superior al dúplex correcto menos estable de ese conjunto particular. Por ejemplo, si se lleva a cabo la hibridación en condiciones que favorecen la secuencia de dúplex de apareamiento perfecto rica en AT, existe la posibilidad de hibridación de una secuencia de dúplex rica en GC que contiene una base con apareamiento erróneo que presenta una temperatura de fusión que todavía es superior al dúplex rico en AT formado correctamente. Por tanto, el diseño de familias de secuencias de oligonucleótido que pueden utilizarse en reacciones de hibridación multiplexadas debe incluir la consideración de las propiedades termodinámicas de los oligonucleótidos y la formación de dúplex que reducirán o eliminarán el comportamiento de hibridación cruzada dentro del conjunto de oligonucleótidos diseñados. GC content of 60%, with its complementary target under conventional conditions, can theoretically present a difference of 10 ° C in melting temperature (Mueller et al., Current Protocols in Mol. Biol .; 15, 5: 1993). Problems in hybridization occur when hybrids are allowed to form under hybridization conditions that include a single hybridization temperature that is not optimal for proper hybridization of all oligonucleotide sequences in a set. Mismatching hybridization of non-complementary probes may occur by forming a duplex with measurable mating stability (Santalucia et al., Biochemistry; 38: 3468-77, 1999). Duplex mismatch may occur in a particular set of oligonucleotides under hybridization conditions in which the mismatch results in a decrease in the stability of the duplex resulting in a Tf greater than the correct less stable duplex of that particular set. For example, if hybridization is carried out under conditions that favor the perfect mating duplex sequence rich in AT, there is the possibility of hybridization of a GC-rich duplex sequence containing a base with erroneous mating that has a temperature of fusion that is still superior to the duplex rich in AT formed correctly. Therefore, the design of families of oligonucleotide sequences that can be used in multiplexed hybridization reactions should include consideration of the thermodynamic properties of oligonucleotides and the formation of duplexes that will reduce or eliminate cross-hybridization behavior within the set of oligonucleotides designed. .

Se ha intentado el desarrollo de tales familias de etiquetas a lo largo de los años con diversos grados de éxito. Hay varios enfoques diferentes para seleccionar secuencias para su utilización en ensayos de hibridación multiplexados. La selección de secuencias que pueden utilizarse como códigos postales o etiquetas en un alineamiento direccionable se ha descrito en la bibliografía de patentes en un enfoque adoptado por Brenner y colaboradores. La patente US nº 5.654.413 describe una población de etiquetas de oligonucleótido (y complementos de etiqueta correspondientes) en la que cada etiqueta de oligonucleótido incluye una pluralidad de subunidades, consistiendo cada subunidad en un oligonucleótido que presenta una longitud de desde tres hasta seis nucleótidos y seleccionándose cada subunidad de un conjunto que presenta hibridación cruzada mínima, en el que una subunidad del conjunto presentará al menos dos apareamientos erróneos con cualquier otra secuencia del conjunto. La tabla II de la memoria descriptiva de la patente de Brenner describe grupos a modo de ejemplo de subunidades de 4 meros que presentan hibridación cruzada mínima según los criterios mencionados anteriormente. En el enfoque adoptado por Brenner, la construcción de oligonucleótidos que no presentan hibridación cruzada se basa en la utilización de subunidades que forman un dúplex que presenta al menos dos apareamientos erróneos con el complemento de cualquier otra subunidad del mismo conjunto. No se define específicamente la ordenación de subunidades en la construcción de etiquetas de oligonucleótido. The development of such tag families over the years has been attempted with varying degrees of success. There are several different approaches to select sequences for use in multiplexed hybridization assays. The selection of sequences that can be used as postal codes or labels in an addressable alignment has been described in the patent literature in an approach adopted by Brenner et al. US Patent No. 5,654,413 describes a population of oligonucleotide tags (and corresponding tag complements) in which each oligonucleotide tag includes a plurality of subunits, each subunit consisting of an oligonucleotide having a length of from three to six nucleotides. and selecting each subunit of a set that has minimal cross hybridization, in which a subunit of the set will have at least two mismatches with any other sequence of the set. Table II of the Brenner patent specification describes exemplary groups of 4-mer subunits that exhibit minimal cross hybridization according to the criteria mentioned above. In the approach adopted by Brenner, the construction of oligonucleotides that do not exhibit cross hybridization is based on the use of subunits that form a duplex that has at least two mismatches with the complement of any other subunit of the same set. The ordering of subunits in the construction of oligonucleotide tags is not specifically defined.

Los parámetros utilizados en el diseño de etiquetas basándose en subunidades se comentan en Barany et al. (documento WO 9731256). Por ejemplo, en el diseño de secuencias de polinucleótido que presentan por ejemplo 24 nucleótidos de longitud (24 meros) derivadas de un conjunto de cuatro posibles tetrámeros en los que cada “dirección” de 24 meros se diferencia de su vecino de 24 meros más próximo en 3 tetrámeros. Comentan además que, si cada tetrámero se diferencia de los otros en al menos dos nucleótidos, entonces cada 24 meros se diferenciarán de los siguientes en al menos seis nucleótidos. Esto se determina sin tener consideración de las inserciones o deleciones cuando se forma la alineación entre dos secuencias cualesquiera del conjunto. De esta manera se genera una secuencia de “código postal” única. El código postal se une a un marcador de una manera dependiente de diana, dando como resultado un “código postal” único que entonces se permite que se hibride con su dirección en el chip. Para minimizar la hibridación cruzada de un “código postal”’ a otras “direcciones”, la reacción de hibridación se lleva a cabo a temperaturas de 75-80ºC. Debido a las condiciones de alta temperatura para la hibridación, 24 meros que presentan homología parcial se hibridan en menor medida que secuencias con una complementariedad perfecta y representan “zonas muertas”. Este enfoque de implementar condiciones de hibridación rigurosas por ejemplo, que suponen hibridación a alta temperatura, también se pone en práctica por Brenner et al. The parameters used in label design based on subunits are discussed in Barany et al. (WO 9731256). For example, in the design of polynucleotide sequences that have, for example, 24 nucleotides in length (24 groupers) derived from a set of four possible tetramers in which each 24-meter "address" differs from its nearest 24-mer neighbor. in 3 tetramers. They further comment that, if each tetramer differs from the others by at least two nucleotides, then every 24 numbers will differ from the following by at least six nucleotides. This is determined without regard to the insertions or deletions when the alignment between any two sequences in the set is formed. In this way a unique “zip code” sequence is generated. The postal code is attached to a marker in a target dependent manner, resulting in a unique "postal code" that is then allowed to hybridize with its address on the chip. To minimize cross-hybridization of a "zip code" to other "addresses", the hybridization reaction is carried out at temperatures of 75-80 ° C. Due to the high temperature conditions for hybridization, 24 groupers that have partial homology hybridize to a lesser extent than sequences with perfect complementarity and represent “dead zones”. This approach of implementing rigorous hybridization conditions for example, which involve high temperature hybridization, is also implemented by Brenner et al.

El actual estado de la tecnología para diseñar etiquetas que no presentan hibridación cruzada basándose en subunidades no proporciona directrices suficientes para construir una familia de números relativamente grandes de secuencias con un valor práctico en ensayos que requieren un comportamiento que no presenta hibridación cruzada riguroso. The current state of the art for designing labels that do not exhibit cross hybridization based on subunits does not provide sufficient guidelines to construct a family of relatively large numbers of sequences with practical value in assays that require behavior that does not exhibit rigorous cross hybridization.

Se ha descrito un procedimiento de secuenciación de de múltiplex en la patente US nº 4.942.124, que se concedió a Church el 17 de julio de 1990. El procedimiento requiere al menos dos vectores que se diferencian entre sí en una secuencia de etiqueta. Se menciona que una secuencia de etiqueta en un vector no se hibridará en condiciones de hibridación rigurosa con una secuencia de etiqueta (es decir, las sondas complementarias no se hibridan de manera cruzada) en otro vector. Se proporcionan condiciones de hibridación rigurosa a modo de ejemplo como 42ºC en tampón de fosfato de sodio 500-1000 mM. En la figura 3 de la memoria descriptiva se proporciona un conjunto de 42 secuencias de etiquetas de 20 meros, todas las cuales carecen de residuos de G. No se proporcionan detalles sobre cómo se obtuvieron las secuencias, aunque Church menciona que inicialmente se eligieron 92 basándose en que presentaban suficiente diversidad de secuencia para garantizar su singularidad. A multiplex sequencing procedure has been described in US Patent No. 4,942,124, which was granted to Church on July 17, 1990. The procedure requires at least two vectors that differ from each other in a tag sequence. It is mentioned that a tag sequence in one vector will not hybridize under stringent hybridization conditions with a tag sequence (i.e., the complementary probes do not cross hybridize) in another vector. Rigorous hybridization conditions are provided by way of example as 42 ° C in 500-1000 mM sodium phosphate buffer. A set of 42 20-meter label sequences is provided in Figure 3 of the specification, all of which lack G residues. No details are provided on how the sequences were obtained, although Church mentions that 92 were initially chosen based on 92. in that they presented enough sequence diversity to guarantee their uniqueness.

Por tanto aunque es posible para un experto en la materia diseñar un pequeño número de etiquetas que no presentan hibridación cruzada, es difícil diseñar un gran número de tales etiquetas. Una solicitud en trámite junto con Therefore, although it is possible for a person skilled in the art to design a small number of labels that do not exhibit cross hybridization, it is difficult to design a large number of such labels. A pending application along with

la presente del propietario de esta solicitud de patente describe un conjunto de este tipo de 210 etiquetas que no presentan hibridación cruzada que presentan un valor práctico. Se describe un procedimiento en la solicitud de patente internacional nº PCT/CA 01/00141 publicada como documento WO 01/59151 el 16 de agosto de 2001. Sin embargo, se proporcionan pocas directrices para proporcionar un conjunto mayor, de por ejemplo 1000 aproximadamente, etiquetas que no presentan hibridación cruzada. Dado que disponer de conjuntos de aproximadamente 1000 etiquetas que no presentan hibridación cruzada, o más, presentaría un valor práctico considerable, sería útil desarrollar un conjunto de este tipo. The present of the owner of this patent application describes such a set of 210 labels that do not have cross hybridization that have a practical value. A procedure is described in International Patent Application No. PCT / CA 01/00141 published as WO 01/59151 on August 16, 2001. However, few guidelines are provided to provide a larger assembly, for example approximately 1000, labels that do not have cross hybridization. Since having sets of approximately 1000 labels that do not have cross hybridization, or more, would have considerable practical value, it would be useful to develop such a set.

Por tanto, aunque es deseable con tales alineamientos disponer, al mismo tiempo, de un gran número de moléculas de dirección, las moléculas de dirección deben ser cada una altamente selectiva para su propia secuencia de complemento. Aunque un alineamiento de este tipo proporciona la ventaja de que la familia de moléculas que constituye la rejilla se diseña completamente, y no se basa en secuencias tal como se producen en la naturaleza, proporcionar una familia de moléculas, que sea suficientemente grande y en la que cada miembro individual sea suficientemente selectivo para su complemento con respecto a todas las demás moléculas de código postal (es decir, en la que haya una hibridación cruzada, o interferencia (“cross-talk”), suficientemente baja) continúa eluyendo a los investigadores. Therefore, although it is desirable with such alignments to have, at the same time, a large number of address molecules, the address molecules must each be highly selective for their own complement sequence. Although such an alignment provides the advantage that the family of molecules constituting the grid is completely designed, and not based on sequences as they occur in nature, providing a family of molecules, which is large enough and in that each individual member is sufficiently selective for its complement with respect to all other zip code molecules (ie, in which there is cross-talk hybridization, or interference ("cross-talk"), low enough) continues to elude researchers .

Sumario de invención Summary of Invention

Se obtuvo una familia de 1168 secuencias utilizando un algoritmo informático para presentar propiedades de hibridación deseables para su utilización en ensayos de detección de ácido nucleico. El conjunto de secuencias de 1168 oligonucleótidos se caracterizó parcialmente en ensayos de hibridación, demostrando la capacidad de los miembros de la familia para hibridarse correctamente con sus secuencias complementarias con una hibridación cruzada mínima. Estas son las secuencias que presentan SEC ID nº: 1 a 1168 de la tabla I. A family of 1168 sequences was obtained using a computer algorithm to present desirable hybridization properties for use in nucleic acid detection assays. The 1168 oligonucleotide sequence set was partially characterized in hybridization assays, demonstrating the ability of family members to properly hybridize with their complementary sequences with minimal cross hybridization. These are the sequences that have SEQ ID NO: 1 to 1168 of table I.

Las familias variantes de secuencias (consideradas etiquetas o complementos de etiqueta) de una familia de secuencias tomada de la tabla I también son parte de la invención. Para fines de evaluación, una familia o conjunto de oligonucleótidos se describirán con frecuencia como una familia de complementos de etiqueta, pero se entenderá que un conjunto de este tipo puede ser fácilmente una familia de etiquetas. The variant families of sequences (considered labels or tag complements) of a family of sequences taken from Table I are also part of the invention. For evaluation purposes, a family or set of oligonucleotides will often be described as a family of tag complements, but it will be understood that such a set can easily be a family of tags.

Una familia de complementos se obtiene a partir de un conjunto de oligonucleótidos basado en una familia de oligonucleótidos tales como los de la tabla I. Para simplificar la evaluación, se describirá proporcionar una familia de complementos basados en los oligonucleótidos de la tabla I. A family of complements is obtained from an oligonucleotide set based on a family of oligonucleotides such as those in Table I. To simplify the evaluation, it will be described to provide a family of complements based on the oligonucleotides in Table I.

En primer lugar, los grupos de secuencias basadas en los oligonucleótidos de la tabla I pueden representarse tal como se muestra en la tabla IA. First, the sequence groups based on the oligonucleotides in Table I can be represented as shown in Table IA.

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Identificador de Identifier of

Patrón numérico Numerical pattern

secuencia sequence

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Patrón numérico Numerical pattern

Tabla IA: Secuencias numéricas que corresponden a patrones de bases de nucleótidos de un conjunto de oligonucleótidos Table IA: Numerical sequences that correspond to nucleotide base patterns of an oligonucleotide set

Identificador de Identifier of

Patrón numérico Numerical pattern

secuencia sequence

En la tabla IA, cada uno de los números de 1 a 3 (identificadores numéricos) representa una base de nucleótido y el patrón de números de 1 a 3 de las secuencias en la lista anterior corresponde al patrón de bases de nucleótido presente en los oligonucleótidos de la tabla I, oligonucleótidos que se ha encontrado que no presentan hibridación In Table IA, each of the numbers 1 to 3 (numerical identifiers) represents a nucleotide base and the pattern of numbers 1 to 3 of the sequences in the above list corresponds to the pattern of nucleotide bases present in the oligonucleotides of table I, oligonucleotides that have been found to have no hybridization

5 cruzada, tal como se describe adicionalmente en los ejemplos detallados. Cada base de nucleótido se selecciona del grupo de bases de nucleótido que consiste en A, C, G y T/U. Una forma de realización particularmente preferida de la invención, en la que se asigna una base específica a cada identificador numérico, se muestra en la tabla I, a continuación. 5, as further described in the detailed examples. Each nucleotide base is selected from the group of nucleotide bases consisting of A, C, G and T / U. A particularly preferred embodiment of the invention, in which a specific basis is assigned to each numerical identifier, is shown in Table I, below.

10 En un aspecto amplio, la invención es una composición que comprende moléculas para su utilización como etiquetas In a broad aspect, the invention is a composition comprising molecules for use as labels.

o complementos de etiqueta en la que cada molécula comprende un oligonucleótido seleccionado de un conjunto de oligonucleótidos basándose en un grupo de secuencias tal como se especifica mediante identificadores numéricos expuestos en la tabla IA. En las secuencias, cada uno de 1 a 3 es una base de nucleótido seleccionada para ser diferente de los otros de 1 a 3 con la condición de que hasta tres bases de nucleótido de cada secuencia pueden or tag complements in which each molecule comprises an oligonucleotide selected from a set of oligonucleotides based on a group of sequences as specified by numerical identifiers set forth in Table IA. In the sequences, each of 1 to 3 is a nucleotide base selected to be different from the others of 1 to 3 with the proviso that up to three nucleotide bases of each sequence can

15 sustituirse por cualquier base de nucleótido siempre que: 15 be replaced by any nucleotide base provided that:

para cualquier par de secuencias del conjunto: for any pair of sequences in the set:

M1 � 16, M2 � 13 M3 � 20, M4 � 16, y M5 � 19, en los que: M1 � 16, M2 � 13 M3 � 20, M4 � 16, and M5 � 19, in which:

20 M1 es el número máximo de apareamientos para cualquier alineación en la que no hay indeles internos; 20 M1 is the maximum number of pairings for any alignment where there are no internal indels;

M2 es la longitud máxima de un bloque de apareamientos para cualquier alineación; M2 is the maximum length of a mating block for any alignment;

M3 es el número máximo de apareamientos para cualquier alineación que presenta una puntuación máxima; M3 is the maximum number of pairings for any alignment that has a maximum score;

M4 es la suma máxima de las longitudes de los dos bloques más largos de apareamientos para cualquier alineación 5 de puntuación máxima; y M4 is the maximum sum of the lengths of the two longest mating blocks for any alignment 5 of maximum score; Y

M5 es la suma máxima de las longitudes de todos los bloques de apareamientos que presentan una longitud de al menos 3, para cualquier alineación de puntuación máxima; M5 is the maximum sum of the lengths of all the mating blocks that have a length of at least 3, for any maximum score alignment;

10 en los que: 10 in which:

la puntuación de una alineación se determina según la ecuación (A x m) - (B x mm) - (C x (og + eg))- (D x eg)), en la que: the score of an alignment is determined according to equation (A x m) - (B x mm) - (C x (og + eg)) - (D x eg)), in which:

15 para cada uno de (i) a (iv): 15 for each of (i) to (iv):

(i)(i)
m = 6, mm = 6, og = 0 y eg = 6,  m = 6, mm = 6, og = 0 and eg = 6,

(ii)(ii)
m = 6, mm = 6, og = 5 y eg= 1,  m = 6, mm = 6, og = 5 and eg = 1,

(iii) m = 6, mm = 2, og = 5 y eg = 1, y 20 (iv) m = 6, mm = 6, og = 6 y eg = 0, (iii) m = 6, mm = 2, og = 5 and eg = 1, and 20 (iv) m = 6, mm = 6, og = 6 and eg = 0,

A es el número total de pares apareados de bases en la alineación; B es el número total de pares apareados de manera errónea internos en la alineación; C es el número total de huecos internos en la alineación; y A is the total number of paired base pairs in the alignment; B is the total number of mismatched pairs internally in the alignment; C is the total number of internal gaps in the alignment; Y

25 D es el número total de indeles internos en la alineación menos el número total de huecos internos en la alineación; y 25 D is the total number of internal indels in the alignment minus the total number of internal gaps in the alignment; Y

en la que la puntuación máxima se determina de manera separada para cada uno de (i), (ii), (iii) y (iv). in which the maximum score is determined separately for each of (i), (ii), (iii) and (iv).

30 En la sección que describe formas de realización detalladas se facilita una explicación de los significados de los parámetros expuestos anteriormente. 30 In the section describing detailed embodiments, an explanation of the meanings of the parameters set forth above is provided.

En otro aspecto amplio, la invención es una composición que contiene moléculas para su utilización como etiquetas In another broad aspect, the invention is a composition containing molecules for use as labels.

o complementos de etiqueta en la que cada molécula comprende un oligonucleótido seleccionado de un conjunto de or tag supplements in which each molecule comprises an oligonucleotide selected from a set of

35 oligonucleótidos basándose en un grupo de secuencias tal como se expone en la tabla IA en el que cada uno de 1 a 3 es una base de nucleótido seleccionada para ser diferente de los otros de 1 a 3 con la condición de que hasta tres bases de nucleótido de cada secuencia pueden sustituirse por cualquier base de nucleótido siempre que: Oligonucleotides based on a group of sequences as set forth in Table IA in which each of 1 to 3 is a nucleotide base selected to be different from the others of 1 to 3 with the proviso that up to three bases of The nucleotide of each sequence can be substituted by any nucleotide base provided that:

para cualquier par de secuencias del conjunto: 40 M1 19, M2 17, M3 21, M4 18, y M5 20, en los que: for any pair of sequences in the set: 40 M1 19, M2 17, M3 21, M4 18, and M5 20, in which:

M1 es el número máximo de apareamientos para cualquier alineación en la que no hay indeles internos; M1 is the maximum number of pairings for any alignment where there are no internal indels;

45 M2 es la longitud máxima de un bloque de apareamientos para cualquier alineación; 45 M2 is the maximum length of a mating block for any alignment;

M3 es el número máximo de apareamientos para cualquier alineación que presenta una puntuación máxima; M3 is the maximum number of pairings for any alignment that has a maximum score;

M4 es la suma máxima de las longitudes de los dos bloques más largos de apareamientos para cualquier alineación 50 de puntuación máxima; y M4 is the maximum sum of the lengths of the two longest mating blocks for any alignment 50 of maximum score; Y

M5 es la suma máxima de las longitudes de todos los bloques de apareamientos que presentan una longitud de al menos 3, para cualquier alineación de puntuación máxima; M5 is the maximum sum of the lengths of all the mating blocks that have a length of at least 3, for any maximum score alignment;

55 en los que 55 in which

la puntuación de una alineación se determina según la ecuación (A x m) - (B x mm) - (C x (og + eg)) - (D x eg)), en la que: the score of an alignment is determined according to equation (A x m) - (B x mm) - (C x (og + eg)) - (D x eg)), in which:

60 para cada uno de (i) a (iv): 60 for each of (i) to (iv):

(i)(i)
m = 6, mm = 6, og = 0 y eg = 6,  m = 6, mm = 6, og = 0 and eg = 6,

(ii)(ii)
m = 6, mm = 6, og = 5 y eg= 1,  m = 6, mm = 6, og = 5 and eg = 1,

(iii) m = 6, mm = 2, og = 5 y eg = 1, y 65 (iv) m = 6, mm = 6, og = 6 y eg = 0, (iii) m = 6, mm = 2, og = 5 and eg = 1, and 65 (iv) m = 6, mm = 6, og = 6 and eg = 0,

A es el número total de pares apareados de bases en la alineación; B es el número total de pares apareados de manera errónea internos en la alineación; C es el número total de huecos internos en la alineación; y D es el número total de indeles internos en la alineación menos el número total de huecos internos en las A is the total number of paired base pairs in the alignment; B is the total number of mismatched pairs internally in the alignment; C is the total number of internal gaps in the alignment; Y D is the total number of internal indels in the alignment minus the total number of internal gaps in the

alineaciones; y en la que la puntuación máxima se determina por separado para cada uno de (i), (ii), (iii) y (iv). En otro aspecto amplio, la invención es una composición que comprende moléculas para su utilización como alignments; Y in which the maximum score is determined separately for each of (i), (ii), (iii) and (iv). In another broad aspect, the invention is a composition comprising molecules for use as

etiquetas o complemento de etiqueta en la que cada molécula comprende un oligonucleótido seleccionado de un conjunto de oligonucleótidos basándose en un grupo de secuencias expuestas en la tabla IA en el que cada uno de 1 a 3 es una base de nucleótido seleccionada para ser diferente de los otros de 1 a 3 con la condición de que hasta tres bases de nucleótido de cada secuencia pueden sustituirse por cualquier base de nucleótido siempre que: tags or tag complement in which each molecule comprises an oligonucleotide selected from a set of oligonucleotides based on a group of sequences set forth in Table IA in which each 1 to 3 is a nucleotide base selected to be different from those others from 1 to 3 with the proviso that up to three nucleotide bases of each sequence can be substituted by any nucleotide base provided that:

para cualquier par de secuencias del conjunto: M1 19, M2 17, M3 21, M4 18, y M5 20, en los que: M1 es el número máximo de apareamientos para cualquier alineación en la que no hay indeles internos; M2 es la longitud máxima de un bloque de apareamientos para cualquier alineación; M3 es el número máximo de apareamientos para cualquier alineación que presenta una puntuación máxima; M4 es la suma máxima de las longitudes de los dos bloques más largos de apareamientos para cualquier alineación for any pair of sequences in the set: M1 19, M2 17, M3 21, M4 18, and M5 20, in which: M1 is the maximum number of pairings for any alignment where there are no internal indels; M2 is the maximum length of a mating block for any alignment; M3 is the maximum number of pairings for any alignment that has a maximum score; M4 is the maximum sum of the lengths of the two longest mating blocks for any alignment

de puntuación máxima; y maximum score; Y

M5 es la suma máxima de las longitudes de todos los bloques de apareamientos que presentan una longitud de al menos 3, para cualquier alineación de puntuación máxima, en los que: la puntuación de una alineación se determina según la ecuación 3A - B - 3C - D, en la que: A es el número total de pares apareados de bases en la alineación; B es el número total de pares apareados de manera errónea internos en la alineación; C es el número total de huecos internos en la alineación; y D es el número total de indeles internos en la alineación menos el número total de huecos internos en la alineación. En aspectos preferidos, la invención proporciona una composición en la que, para el grupo de secuencias de 24 M5 is the maximum sum of the lengths of all the mating blocks that have a length of at minus 3, for any maximum score alignment, in which: the score of an alignment is determined according to equation 3A - B - 3C - D, in which: A is the total number of paired base pairs in the alignment; B is the total number of mismatched pairs internally in the alignment; C is the total number of internal gaps in the alignment; Y D is the total number of internal indels in the alignment minus the total number of internal gaps in the alignment. In preferred aspects, the invention provides a composition in which, for the sequence group of 24

meros en las que 1 = A, 2 = T y 3 = G, en un conjunto definido de condiciones en las que el grado máximo de hibridación entre una secuencia y cualquier complemento de una secuencia diferente del grupo de secuencias de 24 meros no supera el 30% del grado de hibridación entre dicha secuencia y su complemento, para todos de dichos oligonucleótidos de la composición, el grado máximo de hibridación entre un oligonucleótido y un complemento de cualquier otro oligonucleótido de la composición no supera el 50% del grado de hibridación del oligonucleótido y su complemento. numbers in which 1 = A, 2 = T and 3 = G, in a defined set of conditions in which the maximum degree of hybridization between a sequence and any complement of a different sequence of the 24-group sequence does not exceed 30% of the degree of hybridization between said sequence and its complement, for all of said oligonucleotides of the composition, the maximum degree of hybridization between an oligonucleotide and a complement of any other oligonucleotide of the composition does not exceed 50% of the degree of hybridization of the composition. oligonucleotide and its complement.

Más preferentemente, el grado máximo de hibridación entre una secuencia y cualquier complemento de una secuencia diferente no supera el 30% del grado de hibridación entre dicha secuencia y su complemento, el grado de hibridación entre cada secuencia y su complemento varía en un factor de entre 1 y hasta 10, más preferentemente entre 1 y hasta 9, más preferentemente entre 1 y hasta 8, más preferentemente entre 1 y hasta 7, más preferentemente entre 1 y hasta 6, y más preferentemente entre 1 y hasta 5. More preferably, the maximum degree of hybridization between a sequence and any complement of a different sequence does not exceed 30% of the degree of hybridization between said sequence and its complement, the degree of hybridization between each sequence and its complement varies by a factor of between 1 and up to 10, more preferably between 1 and up to 9, more preferably between 1 and up to 8, more preferably between 1 and up to 7, more preferably between 1 and up to 6, and more preferably between 1 and up to 5.

También se prefiere que el grado máximo de hibridación entre una secuencia y cualquier complemento de una secuencia diferente no supere el 25%, más preferentemente no supere el 20%, más preferentemente no supere el 15%, más preferentemente no supere el 10%, más preferentemente no supere el 5%. It is also preferred that the maximum degree of hybridization between a sequence and any complement of a different sequence does not exceed 25%, more preferably does not exceed 20%, more preferably does not exceed 15%, more preferably does not exceed 10%, more preferably it does not exceed 5%.

Incluso más preferentemente, el conjunto definido al que se hizo referencia anteriormente de condiciones da como resultado un nivel de hibridación que es el mismo que el nivel de hibridación obtenido cuando las condiciones de hibridación incluyen 0,2 M NaCl, 0,1 M Tris, Triton X-100 al 0,08%, pH 8,0 a 37ºC. Even more preferably, the defined set referred to above of conditions results in a level of hybridization that is the same as the level of hybridization obtained when hybridization conditions include 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8.0 at 37 ° C.

En la composición, el conjunto definido de condiciones puede incluir que el grupo de secuencias de 24 meros estén In the composition, the defined set of conditions may include that the 24-group sequence group be

unidas covalentemente a perlas. covalently bonded to pearls.

En un aspecto preferido particular, para el grupo de 24 meros el grado máximo de hibridación entre una secuencia y cualquier complemento de una secuencia diferente no supera el 15% del grado de hibridación entre dicha secuencia y su complemento y el grado de hibridación entre cada secuencia y su complemento varía en un factor de entre 1 y hasta 9, y para todos los oligonucleótidos del conjunto, el grado máximo de hibridación entre un oligonucleótido y un complemento de cualquier otro oligonucleótido del conjunto no supera el 20% del grado de hibridación del oligonucleótido y su complemento. In a particular preferred aspect, for the group of 24 numbers the maximum degree of hybridization between a sequence and any complement of a different sequence does not exceed 15% of the degree of hybridization between said sequence and its complement and the degree of hybridization between each sequence. and its complement varies by a factor of 1 to 9, and for all oligonucleotides in the set, the maximum degree of hybridization between an oligonucleotide and a complement of any other oligonucleotide in the set does not exceed 20% of the degree of hybridization of the oligonucleotide and its complement.

Es posible que cada 1 sea uno de A, T/U, G y C; cada 2 sea uno de A, T/U, G y C; y cada 3 sea uno de A, T/U, G y C; y cada uno de 1, 2 y 3 se selecciona para ser diferente de todos los demás de 1, 2 y 3. Más preferentemente, 1 es A o T/U, 2 es A o T/U y 3 es G o C. Incluso más preferentemente, 1 es A, 2 es T/U, y 3 es G. It is possible that each 1 is one of A, T / U, G and C; every 2 is one of A, T / U, G and C; and every 3 is one of A, T / U, G and C; and each of 1, 2 and 3 is selected to be different from all the others of 1, 2 and 3. More preferably, 1 is A or T / U, 2 is A or T / U and 3 is G or C. Even more preferably, 1 is A, 2 is T / U, and 3 is G.

En determinada composición preferida, cada uno de los oligonucleótidos presenta desde veintidós hasta veintiséis bases de longitud, o desde veintitrés hasta veinticinco, y preferentemente, cada oligonucleótido presenta la misma longitud que todos los demás de dichos oligonucleótidos. In a certain preferred composition, each of the oligonucleotides is from twenty-two to twenty-six bases in length, or from twenty-three to twenty-five, and preferably, each oligonucleotide is the same length as all the others of said oligonucleotides.

En una forma de realización particularmente preferida, cada oligonucleótido presenta veinticuatro bases de longitud. In a particularly preferred embodiment, each oligonucleotide is twenty-four bases in length.

Se prefiere que ningún oligonucleótido contenga más de cuatro bases contiguas que sean idénticas entre sí. It is preferred that no oligonucleotide contain more than four contiguous bases that are identical to each other.

También se prefiere que el número de G en cada oligonucleótido no supere L/4 en el que L es el número de bases en dicha secuencia. It is also preferred that the number of G in each oligonucleotide does not exceed L / 4 in which L is the number of bases in said sequence.

Por motivos descritos a continuación, se prefiere que el número de G en cada uno de dichos oligonucleótidos no varíe del número promedio de G en todos los oligonucleótidos en más de uno. Incluso más preferentemente, el número de G en cada uno de dichos oligonucleótidos es el mismo que en todos los demás de dichos oligonucleótidos. En la realización dada a conocer a continuación en la que se sometieron a prueba oligonucleótidos, la secuencia de cada uno presentaba veinticuatro bases de longitud y cada oligonucleótido contenía 6 G. For reasons described below, it is preferred that the number of G in each of said oligonucleotides does not vary from the average number of G in all oligonucleotides in more than one. Even more preferably, the number of G in each of said oligonucleotides is the same as in all other of said oligonucleotides. In the embodiment disclosed below in which oligonucleotides were tested, the sequence of each was twenty-four bases in length and each oligonucleotide contained 6 G.

También se prefiere que, para cada nucleótido, haya como máximo seis bases distintas de G entre cada par de pares vecinos de G. It is also preferred that, for each nucleotide, there are a maximum of six different bases of G between each pair of neighboring pairs of G.

Además, se prefiere que, en el extremo 5’ de cada oligonucleótido al menos una de la primera, segunda, tercera, cuarta, quinta, sexta y séptima bases de la secuencia del oligonucleótido sea una G. De manera similar, se prefiere que en el extremo 3’ de cada oligonucleótido al menos una de la primera, segunda, tercera, cuarta, quinta, sexta y séptima bases de la secuencia del oligonucleótido sea una G. Furthermore, it is preferred that, at the 5 'end of each oligonucleotide at least one of the first, second, third, fourth, fifth, sixth and seventh bases of the oligonucleotide sequence is a G. Similarly, it is preferred that in the 3 'end of each oligonucleotide at least one of the first, second, third, fourth, fifth, sixth and seventh bases of the oligonucleotide sequence is a G.

Es posible disponer de composiciones de secuencias que incluyen ciento sesenta de dichas moléculas, o que incluyen ciento setenta de dichas moléculas, o que incluyen ciento ochenta de dichas moléculas, o que incluyen ciento noventa de dichas moléculas, o que incluyen doscientas de dichas moléculas, o que incluyen doscientas veinte de dichas moléculas, o que incluyen doscientas cuarenta de dichas moléculas, o que incluyen doscientas sesenta de dichas moléculas, o que incluyen doscientas ochenta de dichas moléculas, o que incluyen trescientas de dichas moléculas, o que incluyen cuatrocientas de dichas moléculas, o que incluyen quinientas de dichas moléculas, It is possible to have sequence compositions that include one hundred and sixty of said molecules, or that include one hundred and seventy of said molecules, or that include one hundred and eighty of said molecules, or that include one hundred and ninety of said molecules, or that include two hundred of said molecules, or that include two hundred and twenty of said molecules, or that include two hundred and forty of said molecules, or that include two hundred and sixty of said molecules, or that include two hundred and eighty of said molecules, or that include three hundred of said molecules, or that include four hundred of said molecules molecules, or that include five hundred of said molecules,

o que incluyen seiscientas de dichas moléculas, o que incluyen setecientas de dichas moléculas, o que incluyen ochocientas de dichas moléculas, o que incluyen novecientas de dichas moléculas, o que incluyen mil de dichas moléculas. or that they include six hundred of said molecules, or that they include seven hundred of said molecules, or that they include eight hundred of said molecules, or that they include nine hundred of said molecules, or that they include thousand of said molecules.

Es posible, en determinadas aplicaciones, que cada molécula esté unida a un soporte de fase sólida de modo que pueda distinguirse de una mezcla que contiene otras de las moléculas mediante hibridación con su complemento. Una molécula de este tipo puede unirse a una ubicación definida en un soporte de fase sólida de tal manera que la ubicación definida para cada molécula es diferente de la ubicación definida para otras diferentes de las moléculas. It is possible, in certain applications, that each molecule be bound to a solid phase support so that it can be distinguished from a mixture containing other of the molecules by hybridization with its complement. A molecule of this type can be attached to a defined location on a solid phase support such that the location defined for each molecule is different from the location defined for different molecules.

En determinadas formas de realización, cada soporte de fase sólida es una micropartícula y cada una de dichas moléculas se une covalentemente a una micropartícula diferente de cada una de dichas otras moléculas diferentes. In certain embodiments, each solid phase support is a microparticle and each of said molecules covalently binds to a different microparticle of each of said other different molecules.

En otro aspecto amplio, la invención es una composición que comprende un conjunto de 150 moléculas para su utilización como etiquetas o complementos de etiqueta en la que cada molécula incluye un oligonucleótido que presenta una secuencia de al menos dieciséis bases de nucleótido en la que para cualquier par de secuencias del conjunto: In another broad aspect, the invention is a composition comprising a set of 150 molecules for use as labels or tag complements in which each molecule includes an oligonucleotide having a sequence of at least sixteen nucleotide bases in which for any pair of set sequences:

M1 19/24 x L1, M2 17/24 x L1, M3 21/24 x L1, M4 18/24 x L1, M5 20/24 x L1, en los que L1 es la longitud de la secuencia más corta del par, en los que: M1 19/24 x L1, M2 17/24 x L1, M3 21/24 x L1, M4 18/24 x L1, M5 20/24 x L1, in which L1 is the length of the shortest sequence of the pair, in which:

M1 es el número máximo de apareamientos para cualquier alineación del par de secuencias en el que no hay indeles internos; M1 is the maximum number of pairings for any alignment of the sequence pair in which there are no internal indels;

M2 es la longitud máxima de un bloque de apareamientos para cualquier alineación del par de secuencias; M2 is the maximum length of a matching block for any sequence pair alignment;

M3 es el número máximo de apareamientos para cualquier alineación del par de secuencias que presenta una puntuación máxima; M4 es la suma máxima de las longitudes de los dos bloques más largos de apareamientos para cualquier alineación M3 is the maximum number of pairings for any alignment of the sequence pair that has a maximum score; M4 is the maximum sum of the lengths of the two longest mating blocks for any alignment

del par de secuencias de puntuación máxima; y of the pair of maximum scoring sequences; Y

M5 es la suma máxima de las longitudes de todos los bloques de apareamientos que presentan una longitud de al menos 3, para cualquier alineación del par de secuencias de puntuación máxima, en los que: la puntuación de una alineación se determina según la ecuación (A x m) - (B x mm) - (C x (og + eg)) - (D x eg)), en la M5 is the maximum sum of the lengths of all the matching blocks that have a length of at least 3, for any alignment of the pair of maximum scoring sequences, in which: the score of an alignment is determined according to equation (A xm) - (B x mm) - (C x (og + eg)) - (D x eg)), in the

que: para cada uno de (i) a (iv): that: for each one of (i) to (iv):

(i)(i)
m = 6, mm = 6, og = 0 y eg = 6,  m = 6, mm = 6, og = 0 and eg = 6,

(ii)(ii)
m = 6, mm = 6, og = 5 y eg= 1,  m = 6, mm = 6, og = 5 and eg = 1,

(iii) m = 6, mm = 2, og a 5 y eg = 1, y (iii) m = 6, mm = 2, og a 5 and eg = 1, and

(iv) m = 6, mm = 6, og = 6 y eg = 0, A es el número total de pares apareados de bases en la alineación; B es el número total de pares apareados de manera errónea internos en la alineación; C es el número total de huecos internos en la alineación; y D es el número total de indeles internos en la alineación menos el número total de huecos internos en la alineación; (iv) m = 6, mm = 6, og = 6 and eg = 0, A is the total number of paired base pairs in the alignment; B is the total number of mismatched pairs internally in the alignment; C is the total number of internal gaps in the alignment; Y D is the total number of internal indels in the alignment minus the total number of internal gaps in the alignment;

y en las que la puntuación máxima se determina por separado para cada uno de (i), (ii), (iii) y (iv). En aún otro aspecto amplio, la invención es una composición que incluye un conjunto de 150 moléculas para su and in which the maximum score is determined separately for each of (i), (ii), (iii) and (iv). In yet another broad aspect, the invention is a composition that includes a set of 150 molecules for its

utilización como etiquetas o complementos de etiqueta en la que cada molécula presenta un oligonucleótido que presenta una secuencia de al menos dieciséis bases de nucleótido en la que para cualquier par de secuencias del conjunto: use as labels or tag complements in which each molecule has an oligonucleotide that has a sequence of at least sixteen nucleotide bases in which for any pair of sequences in the set:

M1 19, M2 17, M3 21, M4 18, y M5 20, en los que: M1 19, M2 17, M3 21, M4 18, and M5 20, in which:

M1 es el número máximo de apareamientos para cualquier alineación del par de secuencias en la que no hay indeles internos; M2 es la longitud máxima de un bloque de apareamientos para cualquier alineación del par de secuencias; M3 es el número máximo de apareamientos para cualquier alineación del par de secuencias que presenta una M1 is the maximum number of pairings for any alignment of the sequence pair in which there is no internal indels; M2 is the maximum length of a matching block for any sequence pair alignment; M3 is the maximum number of pairings for any alignment of the sequence pair that has a

puntuación máxima; maximum score;

M4 es la suma máxima de las longitudes de los dos bloques más largos de apareamientos para cualquier alineación del par de secuencias de puntuación máxima; y M5 es la suma máxima de las longitudes de todos los bloques de apareamientos que presentan una longitud de al M4 is the maximum sum of the lengths of the two longest mating blocks for any alignment of the pair of maximum scoring sequences; Y M5 is the maximum sum of the lengths of all the mating blocks that have a length of at

menos 3, para cualquier alineación del par de secuencias de puntuación máxima, en los que: la puntuación de dicha alineación se determina según la ecuación 3A - B - 3C - D, en la que: A es el número total de pares apareados de bases en la alineación; B es el número total de pares apareados de manera errónea internos en la alineación; C es el número total de huecos internos en la alineación; y D es el número total de indeles internos en la alineación menos el número total de huecos internos en la alineación. En determinadas formas de realización de la invención, cada secuencia presenta entre dieciocho y treinta bases de minus 3, for any alignment of the pair of maximum scoring sequences, in which: the score of said alignment is determined according to equation 3A - B - 3C - D, in which: A is the total number of paired base pairs in the alignment; B is the total number of mismatched pairs internally in the alignment; C is the total number of internal gaps in the alignment; Y D is the total number of internal indels in the alignment minus the total number of internal gaps in the alignment. In certain embodiments of the invention, each sequence has between eighteen and thirty bases of

longitud, o entre veinte y veintiocho bases de longitud, o entre veintiuna y veintisiete bases de longitud, o entre length, or between twenty and twenty-eight bases in length, or between twenty-one and twenty-seven bases in length, or between

veintidós y veintiséis bases de longitud. twenty-two and twenty-six bases in length.

Con frecuencia, cada secuencia presenta la misma longitud que cada una de las otras de dichas secuencias. En realizaciones particulares dadas a conocer en la presente memoria, cada secuencia presenta veinticuatro bases de 5 longitud. Frequently, each sequence has the same length as each of the other sequences. In particular embodiments disclosed herein, each sequence has twenty-four bases of 5 length.

De nuevo, ninguna secuencia contiene más de cuatro bases contiguas que son idénticas entre sí, etc., tal como se describió anteriormente. Again, no sequence contains more than four contiguous bases that are identical to each other, etc., as described above.

10 La composición es de tal manera que, en un conjunto definido de condiciones, el grado máximo de hibridación entre un oligonucleótido y cualquier complemento de un oligonucleótido diferente de la composición no supere aproximadamente el 30% del grado de hibridación entre dicho oligonucleótido y su complemento, más preferentemente el 20%, más preferentemente el 15%, más preferentemente el 10%, más preferentemente el 6%. The composition is such that, under a defined set of conditions, the maximum degree of hybridization between an oligonucleotide and any complement of an oligonucleotide other than the composition does not exceed approximately 30% of the degree of hybridization between said oligonucleotide and its complement , more preferably 20%, more preferably 15%, more preferably 10%, more preferably 6%.

15 El conjunto de condiciones da como resultado un nivel de hibridación que es el mismo que el nivel de hibridación obtenido cuando las condiciones de hibridación incluyen 0,2 M NaCl, 0,1 M Tris, Triton X-100 al 0,08%, pH 8,0 a 37ºC, y preferentemente los oligonucleótidos están unidos covalentemente a micropartículas. Evidentemente, es posible que esas condiciones específicas se utilicen para determinar el nivel de hibridación. The set of conditions results in a level of hybridization that is the same as the level of hybridization obtained when the hybridization conditions include 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8.0 at 37 ° C, and preferably the oligonucleotides are covalently bound to microparticles. Obviously, it is possible that these specific conditions are used to determine the level of hybridization.

20 También se prefiere que en tal conjunto definido de condiciones, el grado de hibridación entre cada oligonucleótido y su complemento varíe en un factor de entre 1 y hasta 8, más preferentemente hasta 7, más preferentemente hasta 6, más preferentemente hasta 5. En una realización particular dada a conocer, la varianza observada en el grado de hibridación era un factor de tan sólo 5,3, es decir, el grado de hibridación entre cada oligonucleótido y su complemento varió en un factor de entre 1 y 5,6. It is also preferred that in such a defined set of conditions, the degree of hybridization between each oligonucleotide and its complement varies by a factor between 1 and up to 8, more preferably up to 7, more preferably up to 6, more preferably up to 5. In a Particular embodiment disclosed, the variance observed in the degree of hybridization was a factor of only 5.3, that is, the degree of hybridization between each oligonucleotide and its complement varied by a factor of between 1 and 5.6.

25 En determinadas formas de realización preferidas, en el conjunto definido de condiciones, el grado máximo de hibridación entre uno de dichos oligonucleótidos y cualquier complemento de un oligonucleótido diferente de la composición no supera aproximadamente el 15%, más preferentemente el 10%, más preferentemente el 6%. In certain preferred embodiments, in the defined set of conditions, the maximum degree of hybridization between one of said oligonucleotides and any complement of an oligonucleotide other than the composition does not exceed about 15%, more preferably 10%, more preferably 6%

30 En una forma de realización preferida, el conjunto de condiciones da como resultado un nivel de hibridación que es el mismo que el nivel de hibridación obtenido cuando las condiciones de hibridación incluyen 0,2 M NaCl, 0,1 M Tris, Triton X-100 al 0,08%, pH 8,0 a 37ºC, y los oligonucleótidos están covalentemente unidos a micropartículas. In a preferred embodiment, the set of conditions results in a level of hybridization that is the same as the level of hybridization obtained when the hybridization conditions include 0.2 M NaCl, 0.1 M Tris, Triton X- 0.08% 100, pH 8.0 at 37 ° C, and the oligonucleotides are covalently bound to microparticles.

Además, en el conjunto definido de condiciones, se prefiere que el grado de hibridación entre cada oligonucleótido y Furthermore, in the defined set of conditions, it is preferred that the degree of hybridization between each oligonucleotide and

35 su complemento varía en un factor de entre 1 y hasta 8, más preferentemente hasta 7, más preferentemente hasta 6, más preferentemente hasta 5. Its complement varies by a factor of between 1 and up to 8, more preferably up to 7, more preferably up to 6, more preferably up to 5.

Cualquier composición de la invención puede incluir ciento sesenta de las moléculas de oligonucleótido, o ciento setenta de las moléculas de oligonucleótido, o ciento ochenta de las moléculas de oligonucleótido, o ciento noventa Any composition of the invention may include one hundred and sixty of the oligonucleotide molecules, or one hundred and seventy of the oligonucleotide molecules, or one hundred and eighty of the oligonucleotide molecules, or one hundred and ninety

40 de las moléculas de oligonucleótido, o doscientas de las moléculas de oligonucleótido, o doscientas veinte de las moléculas de oligonucleótido, o doscientas cuarenta de las moléculas de oligonucleótido, o doscientas sesenta de las moléculas de oligonucleótido, o doscientas ochenta de las moléculas de oligonucleótido, o trescientas de las moléculas de oligonucleótido, o cuatrocientas de las moléculas de oligonucleótido, o quinientas de las moléculas de oligonucleótido, o seiscientas de las moléculas de oligonucleótido, o setecientas de las moléculas de oligonucleótido, 40 of the oligonucleotide molecules, or two hundred of the oligonucleotide molecules, or two hundred and twenty of the oligonucleotide molecules, or two hundred and forty of the oligonucleotide molecules, or two hundred and sixty of the oligonucleotide molecules, or two hundred and eighty of the oligonucleotide molecules , or three hundred of the oligonucleotide molecules, or four hundred of the oligonucleotide molecules, or five hundred of the oligonucleotide molecules, or six hundred of the oligonucleotide molecules, or seven hundred of the oligonucleotide molecules,

45 u ochocientas de las moléculas de oligonucleótido, o novecientas de las moléculas de oligonucleótido, o mil o más de las moléculas de oligonucleótido. 45 or eight hundred of the oligonucleotide molecules, or nine hundred of the oligonucleotide molecules, or one thousand or more of the oligonucleotide molecules.

Una composición de la invención puede ser una familia de etiquetas, o puede ser una familia de complementos de etiqueta. A composition of the invention can be a family of tags, or it can be a family of tag add-ons.

50 Una molécula de oligonucleótido que pertenece a una familia de moléculas de la invención puede presentar incorporados en la misma uno o más análogos de bases de nucleótido, siendo preferibles aquellos que se someten a un apareamiento de bases de Watson-Crick normal. An oligonucleotide molecule belonging to a family of molecules of the invention may have one or more nucleotide base analogs incorporated therein, those that undergo normal Watson-Crick base pairing are preferable.

55 La invención incluye kits para clasificar e identificar polinucleótidos. Un kit de este tipo puede incluir uno o más soportes de fase sólida presentando cada uno una o más regiones espacialmente diferenciadas, presentando cada una de tales regiones una población uniforme de complementos de etiqueta sustancialmente idénticos unidos covalentemente. Los complementos de etiqueta están constituidos por un conjunto de oligonucleótidos de la invención. The invention includes kits for classifying and identifying polynucleotides. Such a kit may include one or more solid phase supports each having one or more spatially differentiated regions, each of these regions having a uniform population of substantially identical label complements covalently attached. Label complements are constituted by a set of oligonucleotides of the invention.

60 El uno o más soportes de fase sólida pueden ser un sustrato plano en el que la una o más regiones espacialmente diferenciadas es una pluralidad de regiones espacialmente direccionables. The one or more solid phase supports can be a flat substrate in which the one or more spatially differentiated regions is a plurality of spatially addressable regions.

Los complementos de etiqueta también pueden acoplarse a micropartículas. Las micropartículas presentan 65 preferentemente cada una un diámetro en el intervalo de desde 5 hasta 40 μm. Label complements can also be coupled to microparticles. The microparticles preferably each have a diameter in the range of from 5 to 40 μm.

Un kit de este tipo incluye preferentemente micropartículas que son espectrofotométricamente únicas, y por tanto pueden distinguirse entre sí según técnicas de laboratorio convencionales. Evidentemente, para que tales kits funcionen, cada tipo de micropartícula presentará generalmente sólo un complemento de etiqueta asociado con la misma, y habitualmente habrá un complemento de etiqueta de oligonucleótido diferente asociado con (unido a) cada tipo de micropartícula. Such a kit preferably includes microparticles that are spectrophotometrically unique, and therefore can be distinguished from each other according to conventional laboratory techniques. Obviously, for such kits to work, each type of microparticle will generally have only one label complement associated therewith, and there will usually be a different oligonucleotide label complement associated with (attached to) each type of microparticle.

La invención incluye procedimientos de utilización de familias de oligonucleótidos de la invención. The invention includes methods of using oligonucleotide families of the invention.

Uno de tales procedimientos es de análisis de una muestra biológica que contiene una secuencia biológica para determinar la presencia de una mutación o polimorfismo en un locus del ácido nucleico. El procedimiento incluye: One such procedure is to analyze a biological sample that contains a biological sequence to determine the presence of a mutation or polymorphism in a nucleic acid locus. The procedure includes:

(A) (TO)
amplificar la molécula de ácido nucleico en presencia de un primer cebador que presenta una secuencia en 5’ que presenta la secuencia de una etiqueta complementaria a la secuencia de un complemento de etiqueta que pertenece a una familia de complementos de etiqueta de la invención para formar una molécula amplificada con un extremo 5’ con una secuencia complementaria a la secuencia de la etiqueta; amplifying the nucleic acid molecule in the presence of a first primer that has a 5 'sequence that presents the sequence of a tag complementary to the sequence of a tag complement belonging to a family of tag complements of the invention to form a molecule amplified with a 5 'end with a sequence complementary to the tag sequence;

(B) (B)
extender la molécula amplificada en presencia de una polimerasa y un segundo cebador que presenta un extremo 5’ complementario al extremo 3’ de la secuencia amplificada, extendiéndose el extremo 3’ del segundo cebador hasta inmediatamente adyacente a dicho locus, en presencia de una pluralidad de derivados de nucleósido trifosfato cada uno de los cuales: (i) puede incorporarse durante la transcripción mediante la polimerasa en el extremo 3’ de una cadena de nucleótidos en crecimiento; (ii) provoca la terminación de la polimerización; y (iii) puede detectarse de manera diferencial, entre sí, en el que hay uno de dichos derivados complementario a cada posible nucleótido presente en dicho locus de la secuencia amplificada; extending the amplified molecule in the presence of a polymerase and a second primer having a 5 'end complementary to the 3' end of the amplified sequence, extending the 3 'end of the second primer to immediately adjacent to said locus, in the presence of a plurality of nucleoside triphosphate derivatives each of which: (i) can be incorporated during transcription by polymerase at the 3 'end of a growing nucleotide chain; (ii) causes the termination of the polymerization; and (iii) it can be detected differentially, with one another, in which there is one of said derivatives complementary to each possible nucleotide present in said locus of the amplified sequence;

(C) (C)
hibridar específicamente el segundo cebador con un complemento de etiqueta que presenta la secuencia de complemento de etiqueta de (A); y specifically hybridize the second primer with a tag complement that has the tag complement sequence of (A); Y

(D) (D)
detectar el derivado de nucleótido incorporado en el segundo cebador en (B) para identificar la base situada en el locus del ácido nucleico. detect the nucleotide derivative incorporated in the second primer in (B) to identify the base located in the nucleic acid locus.

En otro procedimiento de la invención, se analiza una muestra biológica que contiene una pluralidad de moléculas de ácido nucleico para determinar la presencia de una mutación o polimorfismo en un locus de cada molécula de ácido nucleico, para cada molécula de ácido nucleico. Este procedimiento incluye las etapas siguientes: In another method of the invention, a biological sample containing a plurality of nucleic acid molecules is analyzed to determine the presence of a mutation or polymorphism in a locus of each nucleic acid molecule, for each nucleic acid molecule. This procedure includes the following stages:

(A) (TO)
amplificar la molécula de ácido nucleico en presencia de un primer cebador que presenta una secuencia en 5’ que presenta la secuencia de una etiqueta complementaria a la secuencia de un complemento de etiqueta que pertenece a una familia de complementos de etiqueta de la invención para formar una molécula amplificada con un extremo 5’ con una secuencia complementaria a la secuencia de la etiqueta; amplifying the nucleic acid molecule in the presence of a first primer that has a 5 'sequence that presents the sequence of a tag complementary to the sequence of a tag complement belonging to a family of tag complements of the invention to form a molecule amplified with a 5 'end with a sequence complementary to the tag sequence;

(B) (B)
extender la molécula amplificada en presencia de una polimerasa y un segundo cebador que presenta un extremo 5’ complementario al extremo 3’ de la secuencia amplificada, extendiéndose el extremo 3’ del segundo cebador hasta inmediatamente adyacente a dicho locus, en presencia de una pluralidad de derivados de nucleósido trifosfato cada uno de los cuales: (i) puede incorporarse durante la transcripción mediante la polimerasa en el extremo 3’ de una cadena de nucleótidos en crecimiento; (ii) provoca la terminación de la polimerización; y (iii) puede detectarse de manera diferencial, entre sí, en el que hay uno de dichos derivados complementario a cada posible nucleótido presente en dicho locus de la molécula amplificada; extending the amplified molecule in the presence of a polymerase and a second primer having a 5 'end complementary to the 3' end of the amplified sequence, extending the 3 'end of the second primer to immediately adjacent to said locus, in the presence of a plurality of nucleoside triphosphate derivatives each of which: (i) can be incorporated during transcription by polymerase at the 3 'end of a growing nucleotide chain; (ii) causes the termination of the polymerization; and (iii) it can be detected differentially, with each other, in which there is one of said derivatives complementary to each possible nucleotide present in said locus of the amplified molecule;

(C) (C)
hibridar específicamente el segundo cebador con un complemento de etiqueta que presenta la secuencia de complemento de etiqueta de (A); y specifically hybridize the second primer with a tag complement that has the tag complement sequence of (A); Y

(D) (D)
detectar el derivado de nucleótido incorporado en el segundo cebador en (B) para identificar la base situada en el locus del ácido nucleico; detect the nucleotide derivative incorporated in the second primer in (B) to identify the base located in the nucleic acid locus;

en el que cada etiqueta de (A) es única para cada molécula de ácido nucleico y las etapas (A) y (B) se llevan a cabo con dichas moléculas nucleicas una en presencia de otra. wherein each label of (A) is unique to each nucleic acid molecule and steps (A) and (B) are carried out with said nucleic molecules in the presence of another.

Otro procedimiento incluye analizar una muestra biológica que contiene una pluralidad de moléculas de ácido nucleico complementarias bicatenarias para determinar la presencia de una mutación o polimorfismo en un locus de cada molécula de ácido nucleico, para cada molécula de ácido nucleico. El procedimiento incluye las etapas de: Another method includes analyzing a biological sample that contains a plurality of complementary double-stranded nucleic acid molecules to determine the presence of a mutation or polymorphism in a locus of each nucleic acid molecule, for each nucleic acid molecule. The procedure includes the steps of:

(A) (TO)
amplificar la molécula bicatenaria en presencia de un par de primeros cebadores, presentando cada cebador una secuencia en 5’ idéntica que presenta la secuencia de una etiqueta complementaria a la secuencia de un complemento de etiqueta que pertenece a una familia de complementos de etiqueta de la invención para formar moléculas amplificadas con extremos 5’ con una secuencia complementaria a la secuencia de la etiqueta; amplifying the double stranded molecule in the presence of a pair of first primers, each primer presenting an identical 5 'sequence presenting the sequence of a tag complementary to the sequence of a tag complement belonging to a family of tag complements of the invention to form amplified molecules with 5 'ends with a sequence complementary to the tag sequence;

(B) (B)
extender las moléculas amplificadas en presencia de una polimerasa y un par de segundos cebadores extend the amplified molecules in the presence of a polymerase and a couple of second primers

presentando cada segundo cebador un extremo 5’ complementario al extremo 3’ de la secuencia amplificada, extendiéndose el extremo 3’ de cada uno de dichos segundos cebadores hasta inmediatamente adyacente a dicho locus, en presencia de una pluralidad de derivados de nucleósido trifosfato cada uno de los cuales: (i) puede incorporarse durante la transcripción mediante la polimerasa en el extremo 3’ de una cadena de each second primer presenting a 5 'end complementary to the 3' end of the amplified sequence, the 3 'end of each of said second primers extending to immediately adjacent to said locus, in the presence of a plurality of nucleoside triphosphate derivatives each of which: (i) may be incorporated during transcription by polymerase at the 3 'end of a chain of

5 nucleótidos en crecimiento; (ii) provoca la terminación de la polimerización; y (iii) puede detectarse de manera diferencial, entre sí; 5 growing nucleotides; (ii) causes the termination of the polymerization; and (iii) can be detected differentially, with each other;

(C) (C)
hibridar específicamente cada uno de los segundos cebadores con un complemento de etiqueta que presenta la secuencia de complemento de etiqueta de (A); y specifically hybridize each of the second primers with a tag complement that has the tag complement sequence of (A); Y

(D) (D)
detectar el derivado de nucleótido incorporado en los segundos cebadores en (B) para identificar la base situada en dicho locus; detecting the nucleotide derivative incorporated in the second primers in (B) to identify the base located in said locus;

en el que la secuencia de cada etiqueta de (A) es única para cada molécula de ácido nucleico y las etapas (A) y (B) 15 se llevan a cabo con dichas moléculas nucleicas una en presencia de otra. wherein the sequence of each label of (A) is unique for each nucleic acid molecule and steps (A) and (B) 15 are carried out with said nucleic molecules one in the presence of another.

En aún otro aspecto, la invención es un procedimiento de análisis de una muestra biológica que contiene una pluralidad de moléculas de ácido nucleico para determinar la presencia de una mutación o polimorfismo en un locus de cada molécula de ácido nucleico, para cada molécula de ácido nucleico, incluyendo el procedimiento las etapas de: In yet another aspect, the invention is a method of analyzing a biological sample that contains a plurality of nucleic acid molecules to determine the presence of a mutation or polymorphism in a locus of each nucleic acid molecule, for each nucleic acid molecule. , including the procedure the stages of:

(a) hibridar la molécula y un cebador, presentando el cebador una secuencia en 5’ que presenta la secuencia de una etiqueta complementaria a la secuencia de un complemento de etiqueta que pertenece a una familia de complementos de etiqueta de la invención y un extremo 3’ que se extiende hasta inmediatamente adyacente al (a) hybridize the molecule and a primer, the primer presenting a 5 'sequence presenting the sequence of a tag complementary to the sequence of a tag complement belonging to a family of tag complements of the invention and an end 3 'extending to immediately adjacent to the

25 locus; 25 locus;

(b) (b)
extender enzimáticamente el extremo 3’ del cebador en presencia de una pluralidad de derivados de nucleósido trifosfato cada uno de los cuales: (i) puede incorporarse enzimáticamente en el extremo 3’ de una cadena de nucleótidos en crecimiento; (ii) provoca la terminación de dicha extensión; y (iii) puede detectarse de manera diferencial, entre sí, en el que hay uno de dichos derivados complementario a cada posible nucleótido presente en dicho locus; enzymatically extending the 3 ′ end of the primer in the presence of a plurality of nucleoside triphosphate derivatives each of which: (i) can be enzymatically incorporated into the 3 ′ end of a growing nucleotide chain; (ii) causes the termination of said extension; and (iii) it can be detected differentially, with one another, in which there is one of said derivatives complementary to each possible nucleotide present in said locus;

(c) (C)
hibridar específicamente el cebador extendido formado en la etapa (b) con un complemento de etiqueta que specifically hybridize the extended primer formed in step (b) with a tag complement that

presenta la secuencia de complemento de etiqueta de (a); y 35 presents the tag complement sequence of (a); and 35

(d) detectar el derivado de nucleótido incorporado en el cebador en la etapa (b) para identificar la base situada en el locus de la molécula de ácido nucleico; (d) detecting the nucleotide derivative incorporated in the primer in step (b) to identify the base located at the locus of the nucleic acid molecule;

en el que cada etiqueta de (a) es única para cada molécula de ácido nucleico y las etapas (a) y (b) se llevan a cabo con dichas moléculas nucleicas una en presencia de otra. wherein each label of (a) is unique to each nucleic acid molecule and steps (a) and (b) are carried out with said nucleic molecules in the presence of another.

El derivado puede ser un didesoxi-nucleósido trifosfato. The derivative can be a dideoxy nucleoside triphosphate.

Cada complemento respectivo puede unirse como una población uniforme de complementos sustancialmente 45 idénticos en regiones espacialmente diferenciadas en uno o más soportes de fase sólida. Each respective complement can be linked as a uniform population of substantially identical complements in spatially differentiated regions on one or more solid phase supports.

Cada complemento de etiqueta puede incluir un marcador, siendo cada uno de tales marcadores diferente para complementos respectivos, y la etapa (d) puede incluir detectar la presencia de los marcadores diferentes para complejos de hibridación respectivos de etiquetas y complementos de etiqueta unidos. Each label complement may include a label, each such label being different for respective complements, and step (d) may include detecting the presence of different markers for respective hybridization complexes of linked labels and label complements.

Otro aspecto de la invención incluye un procedimiento de determinación de la presencia de una diana que se sospecha que está contenida en una mezcla. El procedimiento incluye las etapas de: Another aspect of the invention includes a method of determining the presence of a target that is suspected of being contained in a mixture. The procedure includes the steps of:

(i) marcar la diana con un primer marcador; 55 (i) mark the target with a first marker; 55

(ii) proporcionar un primer resto de detección que puede unirse específicamente a la diana y que incluye una primera etiqueta; (ii) provide a first detection moiety that can specifically bind to the target and that includes a first tag;

(iii) exponer una muestra de la mezcla al resto de detección en condiciones adecuadas para permitir (o provocar) dicha unión específica de la molécula y la diana; (iii) exposing a sample of the mixture to the detection residue under conditions suitable to allow (or cause) said specific binding of the molecule and the target;

(iv) proporcionar una familia de complementos de etiqueta de la invención en la que la familia contiene un primer complemento de etiqueta que presenta una secuencia complementaria a la de la primera etiqueta; (iv) provide a family of tag complements of the invention in which the family contains a first tag compliment that has a sequence complementary to that of the first tag;

65 (v) exponer la muestra a la familia de complementos de etiqueta en condiciones adecuadas para permitir (o provocar) la hibridación específica de la primera etiqueta y su complemento de etiqueta; 65 (v) expose the sample to the family of label complements under appropriate conditions to allow (or cause) the specific hybridization of the first label and its label complement;

(vi) determinar si un dicho primer resto de detección hibridado a un primer dicho complemento de etiqueta está unido a una dicha diana marcada para determinar la presencia o ausencia de dicha diana en la mezcla. (vi) determining whether said first detection residue hybridized to a first said label complement is attached to a said labeled target to determine the presence or absence of said target in the mixture.

5 Preferentemente, el primer complemento de etiqueta está unido a un soporte sólido en una ubicación específica del soporte y la etapa (vi) incluye detectar la presencia del primer marcador en dicha ubicación específica. Preferably, the first tag complement is attached to a solid support at a specific location of the support and step (vi) includes detecting the presence of the first marker at said specific location.

Además, el primer complemento de etiqueta puede incluir un segundo marcador y la etapa (vi) incluye detectar la presencia de los marcadores primero y segundo en un complejo hibridado del resto y el primer complemento de In addition, the first tag complement may include a second marker and step (vi) includes detecting the presence of the first and second markers in a hybrid complex of the rest and the first complement of

10 etiqueta. 10 label

Además, la diana puede seleccionarse de entre el grupo constituido por moléculas orgánicas, antígenos, proteínas, polipéptidos, anticuerpos y ácidos nucleicos. La diana puede ser un antígeno y la primera molécula puede ser un anticuerpo específico para ese antígeno. In addition, the target can be selected from the group consisting of organic molecules, antigens, proteins, polypeptides, antibodies and nucleic acids. The target can be an antigen and the first molecule can be a specific antibody for that antigen.

15 El antígeno es habitualmente un polipéptido o una proteína y la etapa de marcaje puede incluir la conjugación de moléculas fluorescentes, digoxigenina, biotinilación y similares. The antigen is usually a polypeptide or a protein and the labeling step may include the conjugation of fluorescent molecules, digoxigenin, biotinylation and the like.

La diana puede ser un ácido nucleico y la etapa de marcaje puede incluir la incorporación de moléculas 20 fluorescentes, nucleótido radiomarcado, digoxigenina, biotinilación y similares. The target may be a nucleic acid and the labeling step may include the incorporation of fluorescent molecules, radiolabeled nucleotide, digoxigenin, biotinylation and the like.

Descripción detallada de la invención Detailed description of the invention

Figuras Figures

25 Se hace referencia a las figuras adjuntas, en las que 25 Reference is made to the attached figures, in which

La figura 1 ilustra generalmente las etapas seguidas para obtener una familia de secuencias de la presente invención; Figure 1 generally illustrates the steps taken to obtain a family of sequences of the present invention;

30 la figura 2 muestra la intensidad de la señal (MFI) para cada secuencia de apareamiento perfecto (secuencias de sonda indicadas en la tabla I) y su complemento (diana, a 50 fmol) obtenido tal como se describe en el ejemplo 1; Figure 2 shows the signal strength (MFI) for each perfect pairing sequence (probe sequences indicated in Table I) and its complement (target, at 50 fmol) obtained as described in example 1;

la figura 3 es una representación tridimensional que muestra hibridación cruzada observada para las secuencias de Figure 3 is a three-dimensional representation showing cross hybridization observed for the sequences of

35 la figura 2 tal como se describe en el ejemplo 1. Los resultados mostrados en la figura 2 se reproducen a lo largo de la diagonal del dibujo; y Figure 2 as described in Example 1. The results shown in Figure 2 are reproduced along the diagonal of the drawing; Y

la figura 4 es ilustrativa de los resultados obtenidos para una diana individual (SEC ID nº:90, nº de diana 90) cuando se expone a las 100 sondas del ejemplo 1. Se representa gráficamente la MFI para cada perla. Figure 4 is illustrative of the results obtained for an individual target (SEQ ID NO: 90, target No. 90) when exposed to the 100 probes of Example 1. The MFI is plotted for each bead.

40 Formas de realización detalladas 40 Detailed embodiments

La invención proporciona un procedimiento para clasificar mezclas complejas de moléculas mediante la utilización de familias de etiquetas de secuencia de oligonucleótido. Las familias de etiquetas de secuencia de oligonucleótido The invention provides a method for classifying complex mixtures of molecules by utilizing families of oligonucleotide sequence tags. The families of oligonucleotide sequence tags

45 se diseñan de modo que proporcionen una hibridación cruzada mínima durante el proceso de clasificación. Por tanto, cualquier secuencia dentro de una familia de secuencias no presentará hibridación cruzada significativamente con ninguna otra secuencia derivada de esa familia en condiciones de hibridación apropiadas conocidas por los expertos en la materia. La invención es particularmente útil en el procesamiento altamente paralelo de analitos. 45 are designed so as to provide minimal cross hybridization during the classification process. Therefore, any sequence within a family of sequences will not exhibit cross hybridization significantly with any other sequence derived from that family under appropriate hybridization conditions known to those skilled in the art. The invention is particularly useful in the highly parallel processing of analytes.

50 Familias de etiquetas de secuencia de oligonucleótido 50 families of oligonucleotide sequence tags

La presente invención incluye una familia de polinucleótidos de 24 meros que han demostrado que presentan hibridación cruzada mínima entre sí. Esta familia de polinucleótidos es, por tanto, útil como familia de etiquetas, y sus complementos como complementos de etiqueta. The present invention includes a family of 24 grouper polynucleotides that have been shown to exhibit minimal cross hybridization with each other. This family of polynucleotides is, therefore, useful as a family of labels, and their complements as label complements.

55 Con el fin de considerarse para su inclusión en la familia, una secuencia debía satisfacer un determinado número de reglas referentes a su composición. Por ejemplo, estaban prohibidas las regiones de repetición que presentan posibles problemas de hibridación tales como cuatro o más de una base similar (por ejemplo, AAAA o TTTT) o pares de G. Otra regla es que cada secuencia contiene exactamente seis G y ninguna C, con el fin de presentar 55 In order to be considered for inclusion in the family, a sequence had to satisfy a certain number of rules regarding its composition. For example, repeat regions that exhibit possible hybridization problems such as four or more of a similar base (for example, AAAA or TTTT) or pairs of G were prohibited. Another rule is that each sequence contains exactly six G and no C , in order to present

60 secuencias que son más o menos isotérmicas. También se requiere para que se incluya una molécula de 24 meros que sea de como mucho seis bases entre cada par vecino de G. Otra manera de expresar esto es que haya como mucho seis bases distintas a G entre dos G cualesquiera consecutivas. Además, se requirió que cada G más próxima al extremo 5’ (resp. el extremo 3’) de su oligonucleótido (el lado izquierdo (resp. el lado derecho) tal como está escrito en la tabla I) ocupase una de las primeras siete posiciones (contando la posición 5’-terminal (resp. 3’60 sequences that are more or less isothermal. It is also required to include a 24-mer molecule that is at most six bases between each neighboring pair of G. Another way of expressing this is that there are at most six different bases to G between any two consecutive G. In addition, it was required that each G closest to the 5 'end (resp. The 3' end) of its oligonucleotide (the left side (resp. The right side) as written in Table I) occupy one of the first seven positions (counting the 5'-terminal position (resp. 3 '

65 terminal) como la primera.) 65 terminal) as the first.)

El proceso utilizado para designar familias de secuencias que no muestran comportamiento de hibridación cruzada se ilustra generalmente en la figura 1). Dependiendo de la aplicación para la que se utilizarán estas familias de secuencias, se diseñan diversas reglas. Un determinado número de reglas pueden especificar limitaciones para la composición de secuencia (tales como las descritas en el párrafo anterior). Las demás reglas se utilizan para evaluar si dos secuencias son demasiado similares. Basándose en estas reglas, un programa informático puede derivar familias de secuencias que muestran un comportamiento de hibridación cruzada mínimo o no lo muestran. El procedimiento exacto utilizado por el programa informático no es crucial puesto que diversos programas informáticos pueden derivar familias similares basándose en estas reglas. Por ejemplo, se describe un programa de este tipo en la solicitud de patente internacional nº PCT/CA 01/00141 publicada como WO 01/59151 el 16 de agosto de 2001. Otros programas pueden utilizar procedimientos diferentes, tales como los resumidos a continuación. The process used to designate families of sequences that do not show cross hybridization behavior is generally illustrated in Figure 1). Depending on the application for which these sequence families will be used, various rules are designed. A certain number of rules may specify limitations for sequence composition (such as those described in the previous paragraph). The other rules are used to assess whether two sequences are too similar. Based on these rules, a computer program can derive families of sequences that show minimal cross-hybridization behavior or do not show it. The exact procedure used by the computer program is not crucial since various computer programs can derive similar families based on these rules. For example, such a program is described in International Patent Application No. PCT / CA 01/00141 published as WO 01/59151 on August 16, 2001. Other programs may use different procedures, such as those summarized below.

Un primer procedimiento de generación de un número máximo de secuencias de polinucleótido que presentan hibridación cruzada mínima comienza con cualquier número de secuencias sin hibridación cruzada, por ejemplo sólo una secuencia, y aumenta la familia tal como sigue. Se genera un determinado número de secuencias y se compara con las secuencias ya en la familia. Se omiten las secuencias generadas que muestran demasiada similitud con secuencias ya en la familia. Entre las “secuencias candidatas” que quedan, se selecciona una secuencia y se añade a la familia. Las demás secuencias candidatas se comparan entonces con la secuencia seleccionada, y se omiten las que muestran demasiada similitud. Se selecciona una nueva secuencia de las secuencias candidatas restantes, si las hubiera, y se añade a la familia, y así sucesivamente hasta que no quede ninguna secuencia candidata. En esta fase, puede repetirse el proceso (generando un determinado número de secuencias y comparándolas con las secuencias en la familia, etc.) tan a menudo como se desee. La familia obtenida al final de este procedimiento sólo contiene secuencias que presentan hibridación cruzada mínima. A first method of generating a maximum number of polynucleotide sequences exhibiting minimal cross hybridization begins with any number of sequences without cross hybridization, for example only one sequence, and increases the family as follows. A certain number of sequences is generated and compared with the sequences already in the family. Generated sequences that show too much similarity to sequences already in the family are omitted. Among the "candidate sequences" that remain, a sequence is selected and added to the family. The other candidate sequences are then compared with the selected sequence, and those that show too much similarity are omitted. A new sequence of the remaining candidate sequences is selected, if any, and added to the family, and so on until there is no candidate sequence. In this phase, the process can be repeated (generating a certain number of sequences and comparing them with the sequences in the family, etc.) as often as desired. The family obtained at the end of this procedure only contains sequences that exhibit minimal cross hybridization.

Un segundo procedimiento de generación de un número máximo de secuencias de polinucleótido que presentan hibridación cruzada mínima comienza con una familia de tamaño fijado de secuencias de polinucleótido. Las secuencias de esta familia pueden generarse aleatoriamente o diseñarse mediante algún otro procedimiento. Muchas secuencias en esta familia pueden no ser compatibles entre sí, porque muestran demasiada similitud y no presentan hibridación cruzada mínima. Por tanto, es necesario sustituir algunas secuencias por nuevas, ¡con menos similitud! Una manera de lograr esto consiste en sustituir repetidamente una secuencia de la familia por la mejor secuencia (es decir, la de menor similitud) entre un determinado número de secuencias (por ejemplo, generadas aleatoriamente) que no son parte de la familia. Este proceso puede repetirse hasta que la familia de secuencias muestre una mínima similitud, de ahí presente una hibridación cruzada mínima, o hasta que se haya producido un número establecido de sustituciones. Si, al final del proceso, algunas secuencias no obedecen las reglas de similitud que se han establecido, pueden sacarse de la familia, proporcionando por tanto una familia algo menor que sólo contiene secuencias que presentan hibridación cruzada mínima. Pueden añadirse algunas reglas adicionales a este procedimiento con el fin de hacer que sea más eficaz, tales como reglas para determinar qué secuencia se sustituirá. A second method of generating a maximum number of polynucleotide sequences exhibiting minimal cross hybridization begins with a family of fixed size polynucleotide sequences. Sequences of this family can be randomly generated or designed by some other procedure. Many sequences in this family may not be compatible with each other, because they show too much similarity and do not exhibit minimal cross hybridization. Therefore, it is necessary to replace some sequences with new ones, with less similarity! One way to achieve this is to repeatedly replace a family sequence with the best sequence (that is, the one with the least similarity) between a certain number of sequences (for example, randomly generated) that are not part of the family. This process can be repeated until the sequence family shows minimal similarity, hence minimal cross hybridization, or until an established number of substitutions have occurred. If, at the end of the process, some sequences do not obey the similarity rules that have been established, they can be removed from the family, thus providing a somewhat smaller family that only contains sequences that have minimal cross hybridization. Some additional rules may be added to this procedure in order to make it more effective, such as rules to determine which sequence will be replaced.

Se han utilizado procedimientos de este tipo para obtener las 1168 etiquetas que no presentan hibridación cruzada de la tabla I que son el objeto de esta solicitud de patente. Procedures of this type have been used to obtain the 1168 labels that do not exhibit cross hybridization of Table I that are the subject of this patent application.

Una forma de realización de la invención es una composición que comprende moléculas para su utilización como etiquetas o complementos de etiqueta en la que cada molécula comprende un oligonucleótido seleccionado de un conjunto de oligonucleótidos basándose en el grupo de secuencias expuesto en la tabla IA, en el que cada uno de los identificadores numéricos 1 a 3 (véase la tabla) es una base de nucleótido seleccionada para ser diferente de las otras de 1 a 3. Según esta realización, se describen varias familias diferentes de conjuntos específicos de secuencias de oligonucleótido, dependiendo de la asignación de bases realizada a los identificadores numéricos 1 a An embodiment of the invention is a composition comprising molecules for use as labels or tag complements in which each molecule comprises an oligonucleotide selected from a set of oligonucleotides based on the group of sequences set forth in Table IA, in which that each of the numerical identifiers 1 to 3 (see table) is a nucleotide base selected to be different from the others from 1 to 3. According to this embodiment, several different families of specific sets of oligonucleotide sequences are described, depending of the allocation of bases made to numerical identifiers 1 to

3. 3.

Las secuencias contenidas en la tabla I presentan una relación matemática entre sí, descrita tal como sigue. The sequences contained in Table I have a mathematical relationship to each other, described as follows.

Supóngase que S y T son dos secuencias de ADN de longitudes s y t, respectivamente. Aunque el término “alineación” de secuencias de nucleótidos se utiliza ampliamente en el campo de la biotecnología, en el contexto de esta invención el término presenta un significado específico ilustrado en este caso. Una alineación de S y T es una matriz 2xp A (siendo p � s y p � t) de manera que la primera (o segunda) fila de A contiene los caracteres de S (o T respectivamente) en orden, intercalados con espacios p-s (o p-t respectivamente). Se supuso que ninguna columna de la matriz de alineación contenía dos espacios, es decir, que se ignora cualquier alineación en la que una columna contiene dos espacios y no se considera en este caso. Las columnas que contienen la misma base en ambas filas se denominan apareamientos, mientras que las columnas que contienen bases diferentes se denominan apareamientos erróneos. Cada columna de una alineación que contiene un espacio en su primera fila se denomina una inserción y cada columna que contiene un espacio en su segunda fila se denomina una deleción, mientras que una columna de la alineación que contiene un espacio en cualquier fila se denomina un indel. Las inserciones y deleciones dentro de una secuencia se presentan mediante el carácter ’-’. Un hueco es una secuencia continua de espacios en una de las filas (que ni precede inmediatamente ni va seguido inmediatamente por otro espacio en la misma fila) y la longitud de un hueco es el número de espacios en ese hueco. Un hueco interno es uno en el que su primer espacio está precedido por una base y su último espacio va seguido por una base y un indel interno es un indel que pertenece a un hueco interno. Finalmente, un bloque es una secuencia continua de apareamientos (que ni precede inmediatamente ni va seguido inmediatamente por otro apareamiento), y la longitud de un bloque es el número de apareamientos en ese bloque. Con el fin de ilustrar estas definiciones, se consideran dos secuencias S = TGATCGTAGCTACGCCGCG (de longitud s = 19; SEC ID nº:1169) y T = CGTACGATTGCAACGT (de longitud t = 16; SEC ID nº:1170). La alineación a modo de ejemplo R1 de S y T (siendo p = 23) es: Suppose that S and T are two DNA sequences of lengths s and t, respectively. Although the term "alignment" of nucleotide sequences is widely used in the field of biotechnology, in the context of this invention the term has a specific meaning illustrated in this case. An alignment of S and T is a 2xp A matrix (being p � syp � t) so that the first (or second) row of A contains the characters of S (or T respectively) in order, interspersed with spaces ps (or pt respectively). It was assumed that no column of the alignment matrix contained two spaces, that is, any alignment in which one column contains two spaces is ignored and is not considered in this case. Columns that contain the same base in both rows are called matings, while columns that contain different bases are called mating mismatches. Each column of an alignment that contains a space in its first row is called an insertion and each column that contains a space in its second row is called a deletion, while an alignment column that contains a space in any row is called a indel. Insertions and deletions within a sequence are presented by the ’-’ character. A hole is a continuous sequence of spaces in one of the rows (which neither immediately precedes nor is immediately followed by another space in the same row) and the length of a hole is the number of spaces in that hole. An internal hole is one in which its first space is preceded by a base and its last space is followed by a base and an internal indel is an indel that belongs to an internal space. Finally, a block is a continuous sequence of pairings (which neither precedes immediately nor is immediately followed by another pair), and the length of a block is the number of pairings in that block. In order to illustrate these definitions, two sequences S = TGATCGTAGCTACGCCGCG (of length s = 19; SEQ ID NO: 1169) and T = CGTACGATTGCAACGT (of length t = 16; SEQ ID NO: 1170) are considered. The exemplary alignment R1 of S and T (where p = 23) is:

Alineación R1: R1 alignment:

10 Las columnas 1 a 4, 9, 10, 12 y 20 a 23 son indeles, las columnas 6, 7, 8, 11, 13, 14, 16, 17 y 18 son apareamientos, y las columnas 5, 15 y 19 son apareamientos erróneos. Las columnas 9 y 10 forman un hueco de longitud 2, mientras que las columnas 16 a 18 forman un bloque de longitud 3. Las columnas 9, 10 y 12 son indeles internos. 10 Columns 1 to 4, 9, 10, 12 and 20 to 23 are indels, columns 6, 7, 8, 11, 13, 14, 16, 17 and 18 are matings, and columns 5, 15 and 19 are wrong pairings. Columns 9 and 10 form a gap of length 2, while columns 16 to 18 form a block of length 3. Columns 9, 10 and 12 are internal indels.

Se asigna una puntuación a la alineación A de dos secuencias asignando pesos a cada uno de los apareamientos, 15 apareamientos erróneos y huecos tal como sigue: A score is assigned to the alignment A of two sequences assigning weights to each of the pairings, 15 mismatches and gaps as follows:

la recompensa para un apareamiento m, the reward for mating m,

la penalización para un apareamiento erróneo mm, the penalty for wrong mating mm,

• la penalización para la apertura de un hueco og, 20 • la penalización para la extensión de un hueco eg. • the penalty for opening a hole og, 20 • the penalty for extending a hole eg.

Una vez que se establecen estos valores, se asigna una puntuación a cada columna de la alineación según las siguientes reglas: Once these values are established, a score is assigned to each column of the alignment according to the following rules:

25 1. asignar 0 a cada columna que precede al primer apareamiento y a cada columna que sigue al último apareamiento. 25 1. assign 0 to each column that precedes the first pairing and to each column that follows the last pairing.

2. para cada una de las columnas restantes, asignar m si es un apareamiento, -mm si es un apareamiento erróneo, -og-eg si es el primer indel de un hueco, -eg si es un indel pero no el primer indel de un hueco. 2. For each of the remaining columns, assign m if it is a pairing, -mm if it is a wrong pairing, -og-eg if it is the first indel of a hole, -eg if it is an indel but not the first indel of A hole.

30 La puntuación de la alineación A es la suma de las puntuaciones de sus columnas. Se dice que una alineación es de máxima puntuación si ninguna otra alineación de las dos mismas secuencias presenta una mayor puntuación (con los mismos valores de m, mm, og y eg). Una persona entendida en el campo reconocerá este procedimiento de puntuación de una alineación como la puntuación de una alineación local (en oposición a una global) con 30 The alignment score A is the sum of the scores of its columns. An alignment is said to be of maximum score if no other alignment of the two same sequences has a higher score (with the same values of m, mm, og and eg). A person in the field will recognize this procedure of scoring an alignment as the score of a local alignment (as opposed to a global one) with

35 penalizaciones por huecos afines (es decir, penalizaciones por huecos que pueden distinguirse entre el primer indel de un hueco y los demás indeles). Se apreciará que el número total de indeles que abren un hueco es el mismo que el número total de huecos y que un indel interno no es una de las que se les asignó un 0 en la regla (1) anterior. También se observará que la regla (1) anterior asigna un 0 para apareamientos erróneos no internos. Un apareamiento erróneo interno es un apareamiento erróneo que está precedido y va seguido (no necesariamente de 35 penalties for related holes (ie penalties for holes that can be distinguished between the first indel of a hole and the other indels). It will be appreciated that the total number of indels that open a gap is the same as the total number of gaps and that an internal indel is not one of those assigned a 0 in rule (1) above. It will also be noted that rule (1) above assigns a 0 for non-internal mismatches. An internal mating mismatch is an erroneous mating that is preceded and followed (not necessarily by

40 forma inmediata) por un apareamiento. 40 immediately) by mating.

Como ilustración, si los valores de m, mm, og y eg se establecen en 3, 1, 2 y 1 respectivamente, la alineación R1 presenta una puntuación de 19, determinadas tal como se muestra a continuación: As an illustration, if the values of m, mm, og and eg are set to 3, 1, 2 and 1 respectively, the alignment R1 has a score of 19, determined as shown below:

45 Puntuación de la alineación R1 45 R1 alignment score

Obsérvese que para dos secuencias dadas S y T, existen numerosas alineaciones. Existen a menudo varias alineaciones de máxima puntuación. Note that for two given sequences S and T, there are numerous alignments. There are often several high score alignments.

Basándose en estas alineaciones, se definen cinco medidas de similitud de secuencia tal como sigue. Para dos secuencias S y T, y pesos {m, mm, og, eg }: Based on these alignments, five sequence similarity measures are defined as follows. For two sequences S and T, and weights {m, mm, og, eg}:

• M1 es el máximo número de apareamientos a lo largo de todas las alineaciones libres de indeles internos; • M1 is the maximum number of pairings throughout all internal indel-free alignments;

• M2 es la máxima longitud de un bloque a lo largo de todas las alineaciones; 5 • M2 is the maximum length of a block along all alignments; 5

M3 es el máximo número de apareamientos a lo largo de todas las alineaciones de máxima puntuación; M3 is the maximum number of pairings throughout all high score alignments;

M4 es la máxima suma de las longitudes de los dos bloques más largos a lo largo de todas las alineaciones de M4 is the maximum sum of the lengths of the two longest blocks along all the alignments of

máxima puntuación; 10 high score; 10

• M5 es la máxima suma de las longitudes todos los bloques de longitud al menos 3, a lo largo de todas las alineaciones de máxima puntuación. • M5 is the maximum sum of the lengths all the blocks of length at least 3, along all the maximum scoring alignments.

Obsérvese que, por definición, se obtienen las siguientes desigualdades entre estas medidas de similitud: M4 M3 y Note that, by definition, the following inequalities are obtained between these similarity measures: M4 M3 and

15 M5 M3. Además, con el fin de determinar M2 es suficiente con determinar la máxima longitud de un bloque a lo largo de todas las alineaciones libres de indeles internos. Para dos secuencias dadas, los valores de M3 a M5 pueden variar dependiendo de los valores de los pesos {m, mm, og, eg }, pero no de M1 y M2. 15 M5 M3. In addition, in order to determine M2 it is sufficient to determine the maximum length of a block along all internal indel-free alignments. For two given sequences, the values of M3 to M5 may vary depending on the values of the weights {m, mm, og, eg}, but not of M1 and M2.

Para los pesos {3, 1, 2, 1}, la alineación ilustrada no es una alineación de máxima puntuación de las dos secuencias For weights {3, 1, 2, 1}, the alignment illustrated is not a maximum scoring alignment of the two sequences

20 de ejemplo. Pero para los pesos {6, 6, 0, 6} lo es; de ahí que esta alineación muestra que para estas dos secuencias de ejemplo, y los pesos {6, 6, 0, 6}, M2 3, M3 9, M4 6 y M5 6. Con el fin de determinar los valores exactos de M1 a M5, es necesario considerar todas las alineaciones necesarias. M1 y M2 pueden hallarse examinando las s+t-1 alineaciones libres de indeles internos, en las que s y t son las longitudes de las dos secuencias consideradas. Pueden implementarse herramientas matemáticas conocidas como programación dinámica en un ordenador y 20 example. But for weights {6, 6, 0, 6} it is; hence, this alignment shows that for these two example sequences, and weights {6, 6, 0, 6}, M2 3, M3 9, M4 6 and M5 6. In order to determine the exact values of M1 a M5, it is necessary to consider all the necessary alignments. M1 and M2 can be found by examining the s + t-1 free alignments of internal indels, in which s and t are the lengths of the two sequences considered. Mathematical tools known as dynamic programming can be implemented on a computer and

25 utilizarse para determinar M3 a M5 de manera muy rápida. Utilizando un programa informático para realizar estos cálculos, se determinó que: 25 used to determine M3 to M5 very quickly. Using a computer program to perform these calculations, it was determined that:

con los pesos {6, 6, 0, 6}, M1 = 8, M2 = 4, M3 = 10, M4 = 6 y M5 = 6; with weights {6, 6, 0, 6}, M1 = 8, M2 = 4, M3 = 10, M4 = 6 and M5 = 6;

con los pesos {3, 1, 2, 1), M1 = 8, M2 = 4, M3 = 10, M4 = 6 y M5 = 4. with weights {3, 1, 2, 1), M1 = 8, M2 = 4, M3 = 10, M4 = 6 and M5 = 4.

30 Según la realización preferida de esta invención, dos secuencias S y T cada una de longitud 24 son demasiado similares si sucede al menos uno de los siguientes: According to the preferred embodiment of this invention, two sequences S and T each of length 24 are too similar if at least one of the following occurs:

• M1 > 16 o 35 • M2 > 13 o • M1> 16 or 35 • M2> 13 or

M3 > 20 o M3> 20 or

M4 > 16 o M4> 16 or

M5 > 19 M5> 19

40 cuando se utilizan cualquiera de los pesos {6, 6, 0, 6}, o {6, 6, 5, 1}, o {6, 2, 5, 1}, o {6, 6, 6, 0}. En otras palabras, se determinan las cinco medidas de similitud entre S y T para cada uno de los cuatro conjuntos anteriores de pesos, y se comprueban frente a estos umbrales (para un total de 20 pruebas). 40 when any of the weights {6, 6, 0, 6}, or {6, 6, 5, 1}, or {6, 2, 5, 1}, or {6, 6, 6, 0} are used . In other words, the five similarity measures between S and T are determined for each of the four previous sets of weights, and checked against these thresholds (for a total of 20 tests).

Se utilizaron los umbrales anteriores de 16, 13, 20, 16 y 19, y los conjuntos anteriores de pesos, para obtener las The previous thresholds of 16, 13, 20, 16 and 19, and the previous sets of weights were used to obtain the

45 secuencias enumeradas en la tabla I. Por tanto, pueden añadirse secuencias adicionales a las de la tabla I siempre que se sigan las reglas de alineación anteriores para todas las secuencias. 45 sequences listed in Table I. Therefore, additional sequences may be added to those in Table I provided that the above alignment rules are followed for all sequences.

También es posible alterar los umbrales M1, M2, etc., mientras permanezcan dentro del alcance de esta invención. Por tanto, es posible sustituir o añadir secuencias a las de la tabla I, o más generalmente a las de la tabla IA para It is also possible to alter the thresholds M1, M2, etc., while remaining within the scope of this invention. Therefore, it is possible to substitute or add sequences to those in Table I, or more generally to those in Table IA for

50 obtener otros conjuntos de secuencias que mostrarían una hibridación cruzada relativamente baja. Más específicamente, un conjunto de secuencias de 24 meros en las que no existen dos secuencias que sean demasiado similares, en las que demasiado similares se define como: 50 obtain other sets of sequences that would show a relatively low cross hybridization. More specifically, a set of 24-mere sequences in which there are no two sequences that are too similar, in which too similar is defined as:

• M1 > 19 o 55 • M2 > 17 o • M1> 19 or 55 • M2> 17 or

M3 > 21 o M3> 21 or

M4 > 18 o M4> 18 or

M5 > 20 M5> 20

60 cuando se utilizan cualquiera de los pesos {6, 6, 0, 6}, o {6, 6, 5, 1), o {6, 2, 5, 1}, o {6, 6, 6, 0}, también mostrarían baja hibridación cruzada. La reducción de cualquiera de los valores umbral proporciona conjuntos de secuencias con hibridación cruzada incluso menor. Alternativamente, “demasiado similares” también puede definirse como: 60 when any of the weights {6, 6, 0, 6}, or {6, 6, 5, 1), or {6, 2, 5, 1}, or {6, 6, 6, 0} are used , would also show low cross hybridization. Reduction of any of the threshold values provides sets of sequences with even minor cross hybridization. Alternatively, "too similar" can also be defined as:

• M1 > 19 o 65 • M2 > 17 o • M1> 19 or 65 • M2> 17 or

M3 > 21 o M3> 21 or

M4 > 18 o M4> 18 or

M5 > 20 M5> 20

cuando se utilizan cualquiera de los pesos {3, 1, 2, 1}. Alternativamente, otras combinaciones de pesos conducirán a conjuntos de secuencias con baja hibridación cruzada. when any of the weights {3, 1, 2, 1} are used. Alternatively, other combinations of weights will lead to sets of sequences with low cross hybridization.

Obsérvese que utilizar los pesos {6, 6, 0, 6} es equivalente a utilizar los pesos {1, 1, 0, 1}, o pesos {2, 2, 0, 2} , ... (es decir, para dos secuencias cualesquiera, los valores de M1 a M5 son exactamente los mismos ya se utilicen los pesos {6, 6, 0, 6} o {1, 1, 0, 1} o {2, 2, 0, 2} o cualquier otro múltiplo de {1, 1, 0, 1}). Note that using weights {6, 6, 0, 6} is equivalent to using weights {1, 1, 0, 1}, or weights {2, 2, 0, 2}, ... (that is, for any two sequences, the values of M1 to M5 are exactly the same whether weights {6, 6, 0, 6} or {1, 1, 0, 1} or {2, 2, 0, 2} or any another multiple of {1, 1, 0, 1}).

Cuando se trata con secuencias de longitud distinta a 24, o secuencias de diversas longitudes, la definición de similitud puede ajustarse. Tales ajustes son obvios para los expertos en la materia. Por ejemplo, cuando se compara una secuencia de longitudes L1 con una secuencia de longitud L2 (siendo L1<L2), pueden considerarse como demasiado similares cuando When dealing with sequences of length other than 24, or sequences of various lengths, the definition of similarity can be adjusted. Such adjustments are obvious to those skilled in the art. For example, when comparing a sequence of lengths L1 with a sequence of length L2 (being L1 <L2), they can be considered too similar when

M1 > 19/24 x L1 M2 > 17/24 x L1 M3 > 21/24 x L1 M4 > 18/24 x L1 M5 > 20/24 x L1 M1> 19/24 x L1 M2> 17/24 x L1 M3> 21/24 x L1 M4> 18/24 x L1 M5> 20/24 x L1

Cuando se utilizan cualquiera de los pesos {6, 6, 0, 6}, o {6, 6, 5, 1}, o {6, 2, 5, 1} o {6, 6, 6, 0}. When any of the weights {6, 6, 0, 6}, or {6, 6, 5, 1}, or {6, 2, 5, 1} or {6, 6, 6, 0} are used.

Las secuencias de polinucleótido pueden componerse de un subconjunto de bases naturales, lo más preferentemente A, T y G. Las secuencias que son deficientes en una base presentan características útiles, por ejemplo, en la reducción de la formación potencial de estructuras secundarias o un potencial reducido para presentar hibridación cruzada con ácidos nucleicos en la naturaleza. Además, es preferible presentar secuencias de etiqueta que se comportan de manera isotérmica. Esto puede lograrse, por ejemplo, manteniendo una composición de bases constante para todas las secuencias tales como seis G y dieciocho A o T para cada secuencia. Pueden diseñarse conjuntos adicionales de secuencias extrapolando en la familia original de secuencias que no presentan hibridación cruzada mediante procedimientos sencillos conocidos por los expertos en la materia. The polynucleotide sequences can be composed of a subset of natural bases, most preferably A, T and G. Sequences that are deficient in a base have useful characteristics, for example, in reducing the potential formation of secondary structures or a potential reduced to present cross hybridization with nucleic acids in nature. In addition, it is preferable to present tag sequences that behave isothermally. This can be achieved, for example, by maintaining a constant base composition for all sequences such as six G and eighteen A or T for each sequence. Additional sets of sequences can be designed by extrapolating into the original family of sequences that do not exhibit cross hybridization by simple procedures known to those skilled in the art.

Con el fin de validar el conjunto de secuencias, se seleccionó y se caracterizó un subconjunto de secuencias de la familia de 1168 etiquetas de secuencia, en cuanto a la capacidad de estas secuencias para formar estructuras dúplex específicas con sus secuencias complementarias, y el potencial para hibridación cruzada dentro del conjunto de secuencias. Véase el ejemplo 1, a continuación. Se seleccionó aleatoriamente el subconjunto de 100 secuencias, y se analizó utilizando la plataforma Luminex100 LabMAP™. Se inmovilizaron químicamente las 100 secuencias sobre el conjunto de 100 poblaciones de microesferas Luminex diferentes, de manera que se acopló cada secuencia específica con una población de microesferas espectralmente distinta. Entonces se hibridó la combinación de 100 sondas inmovilizadas en microesferas con cada de una las 100 secuencias complementarias correspondientes. Se examinó individualmente cada secuencia para determinar su hibridación específica con su secuencia complementaria, así como para determinar su hibridación no específica con las otras 99 secuencias presentes en la reacción. Este análisis demostró la propensión de cada secuencia a hibridarse sólo con su complemento (apareamiento perfecto), y a no presentar hibridación cruzada de manera apreciable con ninguno de los demás oligonucleótidos presentes en la reacción de hibridación. In order to validate the sequence set, a subset of sequences from the family of 1168 sequence tags was selected and characterized, in terms of the ability of these sequences to form specific duplex structures with their complementary sequences, and the potential to cross hybridization within the sequence set. See example 1, below. The subset of 100 sequences was randomly selected, and analyzed using the Luminex100 LabMAP ™ platform. The 100 sequences were chemically immobilized on the set of 100 different Luminex microsphere populations, so that each specific sequence was coupled with a spectrally different population of microspheres. The combination of 100 probes immobilized in microspheres was then hybridized with each of the corresponding 100 complementary sequences. Each sequence was examined individually to determine its specific hybridization with its complementary sequence, as well as to determine its non-specific hybridization with the other 99 sequences present in the reaction. This analysis demonstrated the propensity of each sequence to hybridize only with its complement (perfect pairing), and to not show cross hybridization appreciably with any of the other oligonucleotides present in the hybridization reaction.

Se encuentra dentro de la capacidad de un experto en la materia, dada la familia de secuencias de la tabla I, modificar las secuencias, o añadir otras secuencias mientras que conservan ampliamente la propiedad de mínima hibridación cruzada que han demostrado presentar los polinucleótidos de la tabla I. It is within the capacity of a person skilled in the art, given the family of sequences in Table I, to modify the sequences, or to add other sequences while largely retaining the property of minimal cross hybridization that the polynucleotides of the table have shown to present. I.

Hay 1168 secuencias de polinucleótido facilitadas en la tabla I. Puesto que los 1168 de esta familia de polinucleótidos pueden actuar entre sí como un conjunto que presenta hibridación cruzada mínima, entonces cualquier pluralidad de polinucleótidos que sea un subconjunto de los 1168 también puede actuar como un conjunto de polinucleótidos que presenta hibridación cruzada mínima. Una aplicación en la que, por ejemplo, van a clasificarse 30 moléculas utilizando una familia de etiquetas y complementos de etiqueta de polinucleótido podría utilizar por tanto cualquier grupo de 30 secuencias mostradas en la tabla I. Esto no quiere decir que puede encontrarse en un sentido práctico que algunos subconjuntos sean más preferidos que otros. Por ejemplo, puede encontrarse que un subconjunto particular es más tolerante a una variedad más amplia de condiciones en las que se realizan la hibridación antes de que el grado de hibridación cruzada se vuelva inaceptable. There are 1168 polynucleotide sequences given in Table I. Since 1168 of this family of polynucleotides can act with each other as a set that exhibits minimal cross hybridization, then any plurality of polynucleotides that is a subset of 1168 can also act as a set of polynucleotides that show minimal cross hybridization. An application in which, for example, 30 molecules are to be classified using a family of labels and polynucleotide label complements could therefore use any group of 30 sequences shown in Table I. This does not mean that it can be found in one direction. practical that some subsets are more preferred than others. For example, it can be found that a particular subset is more tolerant of a wider variety of conditions under which hybridization is performed before the degree of cross hybridization becomes unacceptable.

Puede ser deseable utilizar polinucleótidos que son de longitud más corta que las 24 bases de aquéllos en la tabla I. Podría elegirse una familia de subsecuencias (es decir, submarcos de las secuencias ilustradas) basándose en las contenidas en la tabla I que presentan tan sólo 10 bases por secuencia, siempre que se elijan las subsecuencias para conservar las propiedades de homología entre dos cualesquiera de las secuencias de la familia importantes para su carencia de hibridación cruzada. It may be desirable to use polynucleotides that are shorter in length than the 24 bases of those in Table I. A family of sub-sequences (i.e., submarines of the illustrated sequences) could be chosen based on those contained in Table I which have only 10 bases per sequence, provided that the sub-sequences are chosen to preserve homology properties between any two of the family sequences important for their lack of cross hybridization.

La selección de secuencias utilizando este enfoque sería adecuado para un proceso computerizado. Por tanto, por ejemplo, podría seleccionarse una sucesión de 10 bases contiguas de la primera molécula de 24 meros de la tabla I: AAATTGTGAAAGATTGTTTGTGTA (SEC ID nº:1). Sequence selection using this approach would be suitable for a computerized process. Therefore, for example, a succession of 10 contiguous bases of the first 24-mer molecule could be selected from Table I: AAATTGTGAAAGATTGTTTGTGTA (SEQ ID NO: 1).

Entonces podría seleccionarse la misma sucesión de bases contiguas de la segunda molécula de 24 meros y compararse para determinar la similitud frente a la primera secuencia elegida: GTTAGAGTTAATTGTATTTGATGA (SEC ID nº:2). Una comparación por parejas sistemática podría llevarse a cabo entonces para determinar si se violan los requisitos de similitud. Si el par de secuencias no viola ninguna propiedad establecida, puede seleccionarse una subsecuencia de 10 meros de la tercera secuencia de 24 meros de la tabla I, y compararse con cada una de las dos primeras secuencias de 10 meros (de un modo por parejas para determinar su compatibilidad con las mismas, etc. De esta manera, puede desarrollarse una familia de secuencias de 10 meros. Then the same sequence of contiguous bases of the second 24-mer molecule could be selected and compared to determine the similarity against the first sequence chosen: GTTAGAGTTAATTGTATTTGATGA (SEQ ID NO: 2). A systematic pairwise comparison could then be carried out to determine if similarity requirements are violated. If the sequence pair does not violate any established property, a sub-sequence of 10 mer of the third 24-mer sequence of table I can be selected, and compared with each of the first two sequences of 10 groupers (in a pairwise fashion for determine their compatibility with them, etc. In this way, a family of sequences of 10 numbers can be developed.

Está dentro del alcance de esta invención, obtener familias de secuencias que contienen secuencias de 11 meros, 12 meros, 13 meros, 14 meros, 15 meros, 16 meros, 17 meros, 18 meros, 19 meros, 20 meros, 21 meros, 22 meros y 23 meros en analogía a lo mostrado para secuencias de 10 meros. It is within the scope of this invention, to obtain families of sequences containing sequences of 11 groupers, 12 groupers, 13 groupers, 14 groupers, 15 groupers, 16 groupers, 17 groupers, 18 groupers, 19 groupers, 20 groupers, 21 groupers, 22 mere and 23 mere in analogy to that shown for sequences of 10 groupers.

Puede ser deseable presentar una familia de secuencias en las que hay secuencias de mayor longitud que las secuencias de 24 meros mostradas en la tabla I. Se encuentra dentro de la capacidad de un experto en la materia, dada la familia de secuencias mostrada en la tabla I, obtener una familia de secuencias de este tipo. Un posible enfoque sería insertar en cada secuencia en una o más ubicaciones un nucleótido, base no natural o análogo de manera que la secuencia más larga no debiera presentar una similitud mayor que dos cualesquiera de las secuencias originales que no presentan hibridación cruzada de la tabla I y la adición de bases adicionales a las secuencias de etiqueta no debe dar como resultado un cambio principal en las propiedades termodinámicas de las secuencias de etiqueta de ese conjunto, por ejemplo, el contenido de GC debe mantenerse entre el 10%-40% con una varianza con respecto al promedio del 20%. Este procedimiento de inserción de bases podría utilizarse para obtener, por ejemplo, una familia de secuencias de hasta 40 bases de longitud. It may be desirable to present a family of sequences in which there are sequences of greater length than the 24-meter sequences shown in Table I. It is within the capacity of one skilled in the art, given the family of sequences shown in the table. I, get a family of sequences of this type. One possible approach would be to insert in each sequence in one or more locations a nucleotide, unnatural base or analogue so that the longest sequence should not have a similarity greater than any two of the original sequences that do not exhibit cross hybridization of Table I and the addition of additional bases to the tag sequences should not result in a major change in the thermodynamic properties of the tag sequences of that set, for example, the GC content must be maintained between 10% -40% with a variance with respect to the average of 20%. This procedure of insertion of bases could be used to obtain, for example, a family of sequences of up to 40 bases in length.

Dada una familia de secuencias particular que puede utilizarse como familia de etiquetas (o complementos de etiqueta), por ejemplo, las de la tabla I, un experto reconocerá familias variantes que funcionan igualmente bien. Given a particular family of sequences that can be used as a family of tags (or tag add-ons), for example, those in Table I, an expert will recognize variant families that work equally well.

Tomando de nuevo las secuencias de la tabla I por ejemplo, cada T podría convertirse en una A y viceversa y no se esperaría que se observase un cambio significativo en las propiedades de hibridación cruzada. Esto también sería cierto si cada G se convirtiese en una C. Taking again the sequences of table I for example, each T could become an A and vice versa and a significant change in cross-hybridization properties would not be expected. This would also be true if each G became a C.

Además, podrían tomarse todas las secuencias de una familia para construirse en el sentido 5’-3’, tal como es la convención, o todas las construcciones de secuencias podrían ser en el sentido opuesto (3’-5’). In addition, all sequences of a family could be taken to be constructed in the 5’-3 ’sense, as is the convention, or all sequence constructions could be in the opposite direction (3’-5’).

Existen modificaciones adicionales que pueden llevarse a cabo. Por ejemplo, C no se ha utilizado en la familia de secuencias. La sustitución de C en lugar de una o más G de una secuencia particular produciría una secuencia que presenta al menos una homología tan baja con cualquier otra secuencia de la familia como que la que presentaba la secuencia particular elegida para la modificación. Por tanto, es posible sustituir C en lugar de una o más G en cualquiera de las secuencias mostradas en la tabla I. De forma análoga, es posible sustituir C en lugar de una o más A, o es posible sustituir C en lugar de una o T. There are additional modifications that can be made. For example, C has not been used in the sequence family. The substitution of C instead of one or more G of a particular sequence would produce a sequence that has at least as low a homology with any other family sequence as the one presenting the particular sequence chosen for the modification. Therefore, it is possible to replace C instead of one or more G in any of the sequences shown in Table I. Similarly, it is possible to substitute C instead of one or more A, or it is possible to replace C instead of a or T.

Se prefiere que las secuencias de una familia dada sean de la misma longitud, o aproximadamente igual. Todas las secuencias de una familia de secuencias de esta invención presentan una longitud que presenta una tolerancia de cinco bases de la longitud de bases del media de la familia. Más preferentemente, todas las secuencias presentan una tolerancia de cuatro bases de la longitud de bases promedio. Más preferentemente, todas o casi todas las secuencias presentan una tolerancia de tres bases de la longitud de bases promedio de la familia. Todavía mejor, todas o casi todas las secuencias presentan una longitud que presenta una tolerancia de dos de la longitud de bases del promedio de la familia, e incluso todavía mejor, una tolerancia de una de la longitud de bases del promedio de la familia. It is preferred that the sequences of a given family be of the same length, or approximately equal. All sequences of a family of sequences of this invention have a length that has a tolerance of five bases of the base length of the family mean. More preferably, all sequences have a tolerance of four bases of the average base length. More preferably, all or almost all sequences have a tolerance of three bases of the average family length of bases. Even better, all or almost all sequences have a length that has a tolerance of two of the base length of the family average, and even better, a tolerance of one of the base length of the family average.

También es posible para un experto en la materia derivar conjuntos de secuencias a partir de la familia de secuencias descritas en esta memoria descriptiva y eliminar las secuencias que se esperaría que presentasen propiedades de hibridación no deseables. It is also possible for one skilled in the art to derive sets of sequences from the family of sequences described herein and eliminate sequences that would be expected to exhibit undesirable hybridization properties.

Procedimientos para la síntesis de familias de oligonucleótidos Procedures for the synthesis of oligonucleotide families

Preferentemente, se sintetizan secuencias de oligonucleótido de la invención directamente mediante enfoques de síntesis de fosforamidita convencionales y similares (Caruthers et al, Methods in Enzymology; 154, 287-313: 1987; Lipshutz et al, Nature Genet.; 21, 20-24: 1999; Fodor et al, Science; 251, 763-773: 1991). También pueden utilizarse químicas alternativas, que implican bases no naturales tales como ácidos nucleicos peptídicos o nucleósidos modificados que ofrecen ventajas en la estabilidad de dúplex (Hacia et al; Nucleic Acids Res; 27: 4034-4039, 1999; Nguyen et al, Nucleic Acids Res.; 27, 1492-1498: 1999; Weiler et al, Nucleic Acids Res.; 25, 2792-2799:1997). Preferably, oligonucleotide sequences of the invention are synthesized directly by conventional phosphoramidite synthesis approaches and the like (Caruthers et al, Methods in Enzymology; 154, 287-313: 1987; Lipshutz et al, Nature Genet .; 21, 20-24 : 1999; Fodor et al, Science; 251, 763-773: 1991). Alternative chemicals may also be used, which involve unnatural bases such as peptide nucleic acids or modified nucleosides that offer advantages in duplex stability (Hacia et al; Nucleic Acids Res; 27: 4034-4039, 1999; Nguyen et al, Nucleic Acids Res .; 27, 1492-1498: 1999; Weiler et al, Nucleic Acids Res .; 25, 2792-2799: 1997).

También es posible sintetizar las secuencias de oligonucleótido de esta invención con estructuras principales de nucleótidos alternas tales como nucleótidos de fosforotioato o fosforoamidato. También pueden emplearse procedimientos que implican la síntesis a través de la adición de bloques de secuencia de manera gradual (Lyttle et al, Biotechniques, 19: 274-280 (1995). Puede llevarse a cabo la síntesis directamente sobre el sustrato que va a utilizarse como soporte de fase sólida para la aplicación o puede escindirse el oligonucleótido del soporte para su utilización en disolución o acoplamiento a un segundo soporte. It is also possible to synthesize the oligonucleotide sequences of this invention with main structures of alternate nucleotides such as phosphorothioate or phosphoramidate nucleotides. Methods involving synthesis can also be employed through the addition of sequence blocks gradually (Lyttle et al. Biotechniques, 19: 274-280 (1995). Synthesis can be carried out directly on the substrate to be used as solid phase support for the application or the oligonucleotide can be cleaved from the support for use in solution or coupling to a second support.

Soportes de fase sólida Solid phase brackets

Existen varios soportes de fase sólida diferentes que pueden utilizarse con la invención. Incluyen pero no se limitan a portaobjetos, placas, chips, membranas, perlas, micropartículas y similares. Los soportes de fase sólida también pueden variar en los materiales de los que se componen incluyendo plástico, vidrio, nailon, poliestireno, gel de sílice, látex y similares. La superficie del soporte se recubre con las secuencias de etiqueta complementarias mediante cualquier medio de unión convencional. There are several different solid phase supports that can be used with the invention. They include but are not limited to slides, plates, chips, membranes, beads, microparticles and the like. Solid phase supports can also vary in the materials they are composed of including plastic, glass, nylon, polystyrene, silica gel, latex and the like. The surface of the support is coated with the complementary tag sequences by any conventional means of attachment.

En realizaciones preferidas, la familia de secuencias de complemento de etiqueta se derivatiza para permitir la unión a un soporte sólido. Se conocen muchos procedimientos de derivatización de un ácido nucleico para la unión a un soporte sólido en la técnica (Hermanson G., Bioconjugate Techniques; Acad. Press: 1996). La etiqueta de secuencia puede unirse a un soporte sólido a través de enlaces covalentes o no covalentes (Iannone et al, Cytometry; 39: 131140, 2000; Matson et al, Anal. Biochem.; 224: 110-106, 1995; Proudnikov et al, Anal Biochem; 259: 34-41, 1998; Zammatteo et al, Analytical Biochemistry; 280:143-150, 2000). La etiqueta de secuencia puede derivatizarse convenientemente para la unión a un soporte sólido incorporando ácidos nucleicos modificados en las ubicaciones 5’ ó 3'-terminal. In preferred embodiments, the family of tag complement sequences is derivatized to allow binding to a solid support. Many methods of derivatizing a nucleic acid for binding to a solid support are known in the art (Hermanson G., Bioconjugate Techniques; Acad. Press: 1996). The sequence tag can be attached to a solid support through covalent or non-covalent bonds (Iannone et al, Cytometry; 39: 131140, 2000; Matson et al, Anal. Biochem .; 224: 110-106, 1995; Proudnikov et al, Anal Biochem; 259: 34-41, 1998; Zammatteo et al, Analytical Biochemistry; 280: 143-150, 2000). The sequence tag can be conveniently derivatized for binding to a solid support by incorporating modified nucleic acids at the 5 'or 3'-terminal locations.

Se conocen en la técnica una variedad de restos útiles para la unión a un soporte sólido (por ejemplo, biotina, anticuerpos, y similares), y procedimientos para unirlos a ácidos nucleicos. Por ejemplo, puede unirse una base de ácido nucleico modificada con amina (disponible de, por ejemplo, Glen Research) a un soporte sólido (por ejemplo, Covalink-NH, una superficie de poliestireno injertada con grupos amino secundarios, disponible de Nunc) a través de un agente de reticulación bifuncional (por ejemplo, bis(suberato de sulfosuccinimidilo), disponible de Pierce). Puede añadirse restos espaciadores adicionales para reducir el impedimento estérico entre el resto de captura y la superficie del soporte sólido. A variety of moieties useful for binding to a solid support (eg, biotin, antibodies, and the like), and methods for binding them to nucleic acids are known in the art. For example, an amine modified nucleic acid base (available from, for example, Glen Research) can be attached to a solid support (e.g., Covalink-NH, a surface of grafted polystyrene with secondary amino groups, available from Nunc) to through a bifunctional crosslinking agent (e.g., bis (sulfosuccinimidyl suberate), available from Pierce). Additional spacer residues may be added to reduce the steric hindrance between the rest of the capture and the surface of the solid support.

Unión de etiquetas a analitos para clasificación Union of labels to analytes for classification

Una familia de secuencias de etiqueta de oligonucleótido puede conjugarse a una población de analitos, lo más preferentemente secuencias de polinucleótido de varias maneras diferentes incluyendo pero sin limitarse a síntesis química directa, acoplamiento químico, ligamiento, amplificación, y similares. Las etiquetas de secuencia que se han sintetizado con secuencias de cebadores pueden utilizarse para extensión enzimática del cebador en la diana, por ejemplo en amplificación por PCR. A family of oligonucleotide tag sequences can be conjugated to a population of analytes, most preferably polynucleotide sequences in several different ways including but not limited to direct chemical synthesis, chemical coupling, ligation, amplification, and the like. Sequence tags that have been synthesized with primer sequences can be used for enzymatic extension of the primer on the target, for example in PCR amplification.

Detección de polimorfismos de un solo nucleótido utilizando extensión de cebadores Detection of single nucleotide polymorphisms using primer extension

Existen varias áreas del análisis genético en las que pueden aplicarse familias de secuencias que no presentan hibridación cruzada incluyendo diagnóstico de enfermedades, análisis de polimorfismos de un solo nucleótido, genotipado, análisis de la expresión y similares. Un enfoque de este tipo para análisis genético, denominado el procedimiento de extensión de cebadores (también conocido como análisis de bits genéticos (Nikiforov et al, Nucleic Acids Res.; 22, 4167-4175: 1994; Head et al Nucleic Acids Res.; 25, 5065-5071: 1997)), es un procedimiento extremadamente preciso para la identificación del nucleótido ubicado en un sitio polimórfico específico dentro del ADN genómico. En reacciones de extensión de cebadores convencionales, se amplifica por PCR una parte de ADN genómico que contiene un sitio polimórfico definido utilizando cebadores que flanquean el sitio polimórfico. Con el fin de identificar qué nucleótido está presente en el sitio polimórfico, se sintetiza un tercer cebador de manera que se ubica la posición polimórfica inmediatamente en 3’ con respecto al cebador. Se configura una reacción de extensión de cebadores que contiene el ADN amplificado, el cebador para la extensión, hasta 4 didesoxinucleósidos trifosfato (cada uno marcado con un colorante fluorescente diferente) y una ADN polimerasa tal como la subunidad Klenow de la ADN polimerasa 1. La utilización de didesoxinucleótidos garantiza que se añade una sola base al extremo 3’ del cebador, un sitio correspondiente al sitio polimórfico. De esta manera, puede determinarse la identidad del nucleótido presente en un sitio polimórfico específico mediante la identidad del nucleótido marcado con colorante fluorescente que se incorpora en cada reacción. Un inconveniente principal de este enfoque es su bajo rendimiento. Cada reacción de extensión de cebadores se lleva a cabo independientemente en un tubo separado. There are several areas of genetic analysis in which families of sequences that do not have cross hybridization can be applied including diagnosis of diseases, analysis of single nucleotide polymorphisms, genotyping, expression analysis and the like. Such an approach to genetic analysis, called the primer extension procedure (also known as genetic bit analysis (Nikiforov et al, Nucleic Acids Res .; 22, 4167-4175: 1994; Head et al Nucleic Acids Res .; 25, 5065-5071: 1997)), is an extremely precise procedure for the identification of the nucleotide located at a specific polymorphic site within the genomic DNA. In conventional primer extension reactions, a portion of genomic DNA containing a defined polymorphic site is amplified by PCR using primers flanking the polymorphic site. In order to identify which nucleotide is present at the polymorphic site, a third primer is synthesized so that the polymorphic position is immediately located at 3 ’with respect to the primer. A primer extension reaction containing the amplified DNA, the primer for the extension, is configured up to 4 dideoxynucleoside triphosphates (each labeled with a different fluorescent dye) and a DNA polymerase such as the Klenow subunit of the DNA polymerase 1. Using dideoxynucleotides ensures that a single base is added to the 3 'end of the primer, a site corresponding to the polymorphic site. In this way, the identity of the nucleotide present at a specific polymorphic site can be determined by the identity of the fluorescent dye-labeled nucleotide that is incorporated into each reaction. A major drawback of this approach is its poor performance. Each primer extension reaction is carried out independently in a separate tube.

Pueden utilizarse secuencias universales para potenciar el rendimiento del ensayo de extensión de cebadores tal como sigue. Se amplifica por PCR una región de ADN genómico que contiene múltiples sitios polimórficos. Alternativamente, se amplifican juntas varias regiones genómicas que contienen uno o más sitios polimórficos cada una en una reacción de PCR multiplexada. La reacción de extensión de cebadores se lleva a cabo tal como se describió anteriormente excepto en que los cebadores utilizados son quiméricos, conteniendo cada uno una etiqueta universal única en el extremo 5’ y la secuencia para la extensión en el extremo 3’. De esta manera, cada secuencia Universal sequences can be used to enhance the performance of the primer extension assay as follows. A region of genomic DNA containing multiple polymorphic sites is amplified by PCR. Alternatively, several genomic regions containing one or more polymorphic sites are each amplified together in a multiplexed PCR reaction. The primer extension reaction is carried out as described above except that the primers used are chimeric, each containing a unique universal label at the 5 ′ end and the sequence for extension at the 3 ′ end. In this way, each sequence

específica de gen estaría asociada con una secuencia universal específica. Se hibridarían los cebadores quiméricos con el ADN amplificado y la extensión de cebadores se lleva a cabo tal como se describió anteriormente. Esto daría como resultado una combinación mezclada de cebadores extendidos, cada uno con un colorante fluorescente específico característico del nucleótido incorporado. Tras la reacción de extensión de cebadores, se hibridan las reacciones de extensión mezcladas con un alineamiento que contiene sondas que son complementos inversos de las secuencias universales en los cebadores. Esto segregaría los productos de varias reacciones de extensión de cebadores en combinaciones diferenciadas. El colorante fluorescente presente en cada mancha identificaría entonces el nucleótido incorporado en cada ubicación específica. Pueden realizarse varios procedimientos adicionales para la detección de polimorfismos de un solo nucleótido, incluyendo pero sin limitarse a, reacción en cadena de la polimerasa específica de alelo (ASPCR), extensión de cebadores específica de alelo (ASPE) y ensayo de ligamiento de oligonucleótidos (OLA) por algún experto en la materia en combinación con las secuencias de descritas en la presente memoria. gene specific would be associated with a specific universal sequence. The chimeric primers would be hybridized with the amplified DNA and primer extension is carried out as described above. This would result in a mixed combination of extended primers, each with a specific fluorescent dye characteristic of the incorporated nucleotide. After the primer extension reaction, the extension reactions mixed with an alignment containing probes that are inverse complements of the universal sequences in the primers are hybridized. This would segregate the products of various primer extension reactions in differentiated combinations. The fluorescent dye present in each spot would then identify the nucleotide incorporated in each specific location. Several additional procedures can be performed for the detection of single nucleotide polymorphisms, including but not limited to, allele specific polymerase chain reaction (ASPCR), allele specific primer extension (ASPE) and oligonucleotide binding assay ( OLA) by a person skilled in the art in combination with the sequences described herein.

Kits que utilizan familias de secuencias de etiqueta Kits that use tag sequence families

Las familias de secuencias que no presentan hibridación cruzada pueden proporcionarse en kits para su utilización en, por ejemplo, análisis genético. Tales kits incluyen al menos un conjunto de secuencias que no presentan hibridación cruzada en disolución o sobre un soporte sólido. Preferentemente, las secuencias se unen a micropartículas y se proporcionan con tampones y reactivos que son apropiados para la aplicación. Los reactivos pueden incluir enzimas, nucleótidos, marcadores fluorescentes y similares que se requerirían para aplicaciones específicas. Se proporcionarán instrucciones para la utilización correcta del kit para una aplicación dada. Sequence families that do not exhibit cross hybridization can be provided in kits for use in, for example, genetic analysis. Such kits include at least one set of sequences that do not exhibit cross hybridization in solution or on a solid support. Preferably, the sequences bind to microparticles and are provided with buffers and reagents that are appropriate for the application. Reagents may include enzymes, nucleotides, fluorescent markers and the like that would be required for specific applications. Instructions for the correct use of the kit for a given application will be provided.

Ejemplos Examples

EJEMPLO 1 - Comportamiento de interferencia de secuencia en perlas EXAMPLE 1 - Behavior sequence interference in beads

Se sometió a prueba un grupo de 100 secuencias, seleccionadas aleatoriamente de la tabla I, para determinar la viabilidad para su utilización como familia de oligonucleótidos que presentan hibridación cruzada mínima. Las 100 secuencias seleccionadas se indican por separado en la tabla I junto con los números asignados a las secuencias en las pruebas. A group of 100 sequences, randomly selected from Table I, was tested to determine the feasibility for use as a family of oligonucleotides that exhibit minimal cross hybridization. The 100 selected sequences are indicated separately in Table I along with the numbers assigned to the sequences in the tests.

Se realizaron las pruebas utilizando la plataforma Luminex LabMAP™ disponible de Luminex Corporation, Austin, Texas, USA Se sintetizaron las cien secuencias, utilizadas como sondas, como oligonucleótidos por Integrated DNA Technologies (IDT, Coralville, Iowa, USA). Cada sonda incluía un grupo de unión de amino C6 acoplado al extremo 5’ del oligonucleótido a través de un espaciador de etilenglicol C12. La molécula de unión de amino C6 es un espaciador de seis carbonos que contiene un grupo de amina que puede utilizarse para unir el oligonucleótido a un soporte sólido. También se sintetizaron cien dianas de oligonucleótido (complementos de sonda), siendo la secuencia de cada una el complemento inverso de las 100 secuencias de sonda, por IDT. Se marcó cada diana en su extremo 5’ con biotina. Se purificaron todos los oligonucleótidos utilizando procedimientos de desalación convencionales, y se reconstituyeron hasta una concentración de aproximadamente 200 μM en agua destilada, estéril para su utilización. Se determinaron espectrofotométricamente las concentraciones de oligonucleótido utilizando los coeficientes de extinción proporcionados por el proveedor. The tests were performed using the Luminex LabMAP ™ platform available from Luminex Corporation, Austin, Texas, USA. The hundred sequences, used as probes, were synthesized as oligonucleotides by Integrated DNA Technologies (IDT, Coralville, Iowa, USA). Each probe included a C6 amino linking group coupled to the 5 ’end of the oligonucleotide through a C12 ethylene glycol spacer. The C6 amino-binding molecule is a six-carbon spacer that contains an amine group that can be used to bind the oligonucleotide to a solid support. One hundred oligonucleotide targets (probe complements) were also synthesized, the sequence of each being the inverse complement of the 100 probe sequences, by IDT. Each target was marked at its 5 ’end with biotin. All oligonucleotides were purified using conventional desalination procedures, and reconstituted to a concentration of approximately 200 µM in distilled, sterile water for use. Oligonucleotide concentrations were determined spectrophotometrically using the extinction coefficients provided by the supplier.

Se acopló cada sonda por su grupo de unión de amino a una microesfera fluorescente carboxilada del sistema LapMAP según el protocolo de Luminex100. La microesfera, o perla, para cada secuencia de sonda presenta características de absorción de luz únicas, o espectralmente distintas, lo que permite que se distinga cada sonda de las demás sondas. Se dispersaron sedimentos de perlas de disolución madre mediante sonicación y luego agitación en vórtex. Para cada población de perlas, se retiraron cinco millones de microesferas (400 μl) del tubo de disolución madre utilizando puntas con filtro y se añadieron a un tubo Eppendorf de 1,5 ml (USA Scientific). Entonces se centrifugaron las microesferas, se retiró el sobrenadante, y se resuspendieron las perlas en 25 μl de MES (ácido 2(N-morfolino)etanosulfónico) (Sigma) 0,2 M, pH 4,5, seguido por agitación en vórtex y sonicación. Se añadió un nmol de cada sonda (en un volumen de 25 μl) a su correspondiente población de perlas. Se añadió un volumen de 2,5 μl de agente de reticulación EDC (clorhidrato de 1-etil-3-(3-dimetilaminopropil)carbodiimida (Pierce), preparado inmediatamente antes de su utilización añadiendo 1,0 ml de ddH2O estéril a 10 mg de polvo de EDC, a cada población de microesferas. Entonces se incubaron las mezclas de perlas durante 30 minutos a temperatura ambiente en la oscuridad con agitación periódica en vórtex. Entonces se añadió una segunda alícuota de 2,5 μl de disolución de EDC recién preparada seguido por una incubación adicional durante 30 minutos en la oscuridad. Tras la segunda incubación con EDC, se añadió 1,0 ml de Tween-20 al 0,02% (BioShop) a cada mezcla de perlas y se agitó en vórtex. Se centrifugaron las microesferas, se retiró el sobrenadante, y se resuspendieron las perlas en 1,0 ml de dodecilsulfato de sodio al 0,1% (Sigma). Se centrifugaron de nuevo las perlas y se retiró el sobrenadante. Se resuspendieron las perlas acopladas en 100 μl de MES 0,1 M pH 4,5. Se determinaron entonces las concentraciones de perlas diluyendo cada preparación 100 veces en ddH2O y enumerándola utilizando un hemocitómetro Neubauer BrightLine. Se almacenaron las perlas acopladas como poblaciones individuales a 8ºC protegidas de la luz. Each probe was coupled by its amino binding group to a carboxylated fluorescent microsphere of the LapMAP system according to the Luminex100 protocol. The microsphere, or pearl, for each probe sequence has unique or spectrally different light absorption characteristics, which allows each probe to be distinguished from the other probes. Sediments of mother solution beads were dispersed by sonication and then vortexing. For each pearl population, five million microspheres (400 μl) were removed from the mother liquor tube using filter tips and added to a 1.5 ml Eppendorf tube (USA Scientific). The microspheres were then centrifuged, the supernatant was removed, and the beads were resuspended in 25 μl of MES (2 (N-morpholino) ethanesulfonic acid) (Sigma) 0.2 M, pH 4.5, followed by vortexing and sonication One nmol of each probe (in a volume of 25 μl) was added to its corresponding pearl population. A volume of 2.5 μl of EDC crosslinking agent (1-ethyl-3- (3-dimethylaminopropyl) carbodiimide hydrochloride (Pierce), prepared immediately prior to use, was added by adding 1.0 ml of sterile ddH2O to 10 mg of EDC powder, to each population of microspheres, then the pearl mixtures were incubated for 30 minutes at room temperature in the dark with periodic vortex agitation, then a second 2.5 μl aliquot of freshly prepared EDC solution was added followed by an additional incubation for 30 minutes in the dark After the second incubation with EDC, 1.0 ml of 0.02% Tween-20 (BioShop) was added to each pearl mixture and vortexed. the microspheres, the supernatant was removed, and the beads were resuspended in 1.0 ml of 0.1% sodium dodecyl sulfate (Sigma), the beads were centrifuged again and the supernatant was removed, the coupled beads were resuspended in 100 μl of MONTH 0.1 M pH 4.5 Pearl concentrations were then determined by diluting each preparation 100 times in ddH2O and enumerating it using a Neubauer BrightLine hemocytometer. The coupled beads were stored as individual populations at 8 ° C protected from light.

Se evaluó la densidad relativa de sondas de oligonucleótido en cada población de perlas mediante marcaje de The relative density of oligonucleotide probes in each pearl population was assessed by labeling

extremos mediante desoxinucleotidil transferasa terminal (TdT) con biotina-ddUTP. Se utilizó TdT para marcar los extremos 3’ de ADN “monocatenario” con un ddNTP marcado. Brevemente, se pipetearon 180 μl de la combinación de 100 poblaciones de perlas (equivalentes a aproximadamente 4000 de cada tipo de perla) que iban a utilizarse para las hibridaciones en un tubo Eppendorf y se centrifugaron. Se retiró el sobrenadante, y se lavaron las perlas en tampón 1x TdT. Entonces se incubaron las perlas con una mezcla de reacción de marcaje, que consistía en tampón 5x TdT, CoCl2 25 mM, y 1000 pmol de biotina-16-ddUTP (se adquirieron todos los reactivos de Roche). Se enrasó el volumen de reacción total hasta 85,5 μl con H2O destilada, estéril y se incubaron las muestras en la oscuridad durante 1 hora a 37ºC. Se añadió una segunda alícuota de enzima, seguido por una segunda incubación durante 1 hora. Se hicieron correr las muestras por duplicado, como se hizo con el control negativo, que contenía todos los componentes excepto la TdT. Con el fin de eliminar el biotina-ddUTP no incorporado, se lavaron las perlas 3 veces con 200 μl de tampón de hibridación, y se resuspendieron las perlas en 50 μl de tampón de hibridación tras el lavado final. Se detectó espectrofotométricamente el marcador de biotina utilizando SA-PE (conjugado de estreptavidinaficoeritrina). La estreptavidina se une a biotina y la ficoeritrina es espectralmente distinta de las perlas de sonda. Se diluyó la disolución madre 10 mg/ml de SA-PE 100 veces en tampón de hibridación, y se añadieron 15 μl del SA-PE diluido directamente a cada reacción y se incubó durante 15 minutos a 37ºC. Se analizaron las reacciones en el aparato Luminex100 LabMAP. Se fijaron los parámetros de adquisición para medir 100 acontecimientos por perla utilizando un volumen de muestra de 50 μl. ends by terminal deoxynucleotidyl transferase (TdT) with biotin-ddUTP. TdT was used to label the 3 'ends of "single stranded" DNA with a labeled ddNTP. Briefly, 180 μl of the combination of 100 pearl populations (equivalent to approximately 4000 of each type of pearl) that were to be used for hybridization in an Eppendorf tube were pipetted and centrifuged. The supernatant was removed, and the beads were washed in 1x TdT buffer. The beads were then incubated with a labeling reaction mixture, which consisted of 5x TdT buffer, 25 mM CoCl2, and 1000 pmol of biotin-16-ddUTP (all Roche reagents were purchased). The total reaction volume was made up to 85.5 μl with sterile distilled H2O and the samples were incubated in the dark for 1 hour at 37 ° C. A second enzyme aliquot was added, followed by a second incubation for 1 hour. Samples were run in duplicate, as was done with the negative control, which contained all components except TdT. In order to remove the unincorporated biotin-ddUTP, the beads were washed 3 times with 200 µl of hybridization buffer, and the beads were resuspended in 50 µl of hybridization buffer after the final wash. The biotin marker was detected spectrophotometrically using SA-PE (streptavidinophoreitrin conjugate). Streptavidin binds to biotin and phycoerythrin is spectrally different from probe beads. The stock solution was diluted 10 mg / ml SA-PE 100 times in hybridization buffer, and 15 µl of the diluted SA-PE was added directly to each reaction and incubated for 15 minutes at 37 ° C. The reactions in the Luminex100 LabMAP apparatus were analyzed. Acquisition parameters were set to measure 100 events per bead using a sample volume of 50 μl.

Se muestran los resultados obtenidos en la figura 2. Tal como puede observarse, la intensidad media de fluorescencia (MFI) de las perlas varía desde 840,3 hasta 3834,9, un intervalo de 4,56 veces. Suponiendo que las reacciones de marcaje son completas para todos los oligonucleótidos, esto ilustra la intensidad de señal que se obtendría para cada tipo de perla a esta concentración si la diana (es decir, el complemento marcado) se uniera a la secuencia de sonda en toda la extensión posible. The results obtained in Figure 2 are shown. As can be seen, the average fluorescence intensity (MFI) of the beads varies from 840.3 to 3834.9, a range of 4.56 times. Assuming that the labeling reactions are complete for all oligonucleotides, this illustrates the signal strength that would be obtained for each type of bead at this concentration if the target (i.e., the labeled complement) bound to the entire probe sequence. The possible extension.

Se evaluó la hibridación cruzada de las dianas a las sondas tal como sigue. Se combinaron 100 sondas de oligonucleótido unidas a 100 poblaciones de perlas diferentes, tal como se describió anteriormente, para generar una mezcla madre de perlas maestra, que permitiese que se llevasen a cabo reacciones multiplexadas. Entonces se hibridó individualmente la combinación de microesfera-sondas inmovilizadas con cada diana biotinilada. Por tanto, se examinó cada diana individualmente para determinar su hibridación específica con su secuencia complementaria inmovilizada en perla, así como para determinar su hibridación no específica con las otras 99 secuencias universales inmovilizadas en perla presentes en la reacción. Para cada reacción de hibridación, se añadieron 25 μl de mezcla de perlas (que contenía aproximadamente 2500 de cada población de perlas en tampón de hibridación) a cada pocillo de una placa para PCR Thermowell de 96 pocillos y se equilibró a 37ºC. Se diluyó cada diana hasta una concentración final de 0,002 fmol/μl en tampón de hibridación, y se añadieron 25 μl (50 fmol) a cada pocillo, proporcionando un volumen de reacción final de 50 μl. El tampón de hibridación consistía en NaCl 0,2 M, Tris 0,1 M, Triton X-100 al 0,08%, pH 8,0 y se realizaron las hibridaciones a 37ºC durante 30 minutos. Se analizó cada diana por triplicado y se incluyeron seis muestras de fondo (es decir, sin diana) en cada placa. Se utilizó un conjugado SA-PE como indicador, tal como se describió anteriormente. Se diluyó la disolución madre 10 mg/ml de SA-PE 100 veces en tampón de hibridación, y se añadieron 15 μl del SA-PE diluido directamente a cada reacción, sin eliminación de la diana no unida, y se incubó durante 15 minutos a 37ºC. Finalmente, se añadieron 35 μl adicionales de tampón de hibridación a cada pocillo, dando como resultado un volumen final de 100 μl por pocillo antes del análisis en el aparato Luminex100 LabMAP. Se fijaron los parámetros de adquisición para medir 100 acontecimientos por perla utilizando un volumen de muestra de 80 μl. Cross hybridization of the targets to the probes was evaluated as follows. 100 oligonucleotide probes bound to 100 different pearl populations were combined, as described above, to generate a masterbatch of master beads, allowing multiplexed reactions to be carried out. The combination of immobilized microspheres-probes with each biotinylated target was then individually hybridized. Therefore, each target was examined individually to determine its specific hybridization with its complementary sequence immobilized in pearl, as well as to determine its non-specific hybridization with the other 99 universal sequences immobilized in pearl present in the reaction. For each hybridization reaction, 25 µl of pearl mixture (containing approximately 2500 of each population of beads in hybridization buffer) was added to each well of a 96-well Thermowell PCR plate and equilibrated at 37 ° C. Each target was diluted to a final concentration of 0.002 fmol / µl in hybridization buffer, and 25 µl (50 fmol) was added to each well, providing a final reaction volume of 50 µl. The hybridization buffer consisted of 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8.0 and hybridizations were performed at 37 ° C for 30 minutes. Each target was analyzed in triplicate and six background samples (i.e. no target) were included in each plate. An SA-PE conjugate was used as an indicator, as described above. The stock solution was diluted 10 mg / ml SA-PE 100 times in hybridization buffer, and 15 µl of the diluted SA-PE was added directly to each reaction, without removal of the unbound target, and incubated for 15 minutes at 37 ° C Finally, an additional 35 µl of hybridization buffer was added to each well, resulting in a final volume of 100 µl per well before analysis in the Luminex100 LabMAP. Acquisition parameters were set to measure 100 events per bead using a sample volume of 80 μl.

Se calculó la hibridación en porcentaje para cualquier acontecimiento en el que la MFI neta era al menos 3 veces el fondo cero de la diana. En otras palabras, se realizó un cálculo para cualquier muestra en la que (MFImuestra-MFIfondo cero de diana) / MFIfondo cero de diana 3. Percent hybridization was calculated for any event in which the net MFI was at least 3 times the zero bottom of the target. In other words, a calculation was made for any sample in which (MFIsample-MFI zero target fund) / MFI zero fund target 3.

Se calculó la mediana de la intensidad de fluorescencia neta (MFImuestra-MFIfondo cero de diana) generada para las 10.000 posibles combinaciones de diana/sonda. Como hay 100 sondas y 100 dianas, hay 100 x 100 = 10.000 posibles interacciones diferentes posibles de las que 100 son el resultado de hibridaciones perfectas. Las 9900 restantes resultan de la hibridación de una diana con una sonda de apareamiento erróneo. Un acontecimiento de hibridación cruzada se define entonces como un acontecimiento no específico cuya mediana de la intensidad de fluorescencia neta supera 3 veces el fondo cero de la diana. En otras palabras, sólo va a realizarse un cálculo de interferencia para cualquier muestra en la que (MFImuestra-MFIfondo cero de diana) / MFIfondo cero de diana 3. Se cuantificaron los acontecimientos de hibridación cruzada expresando el valor de la señal de hibridación cruzada como un porcentaje de la señal de hibridación de apareamiento perfecto con la misma sonda. The median of the net fluorescence intensity (MFI sample-MFI zero target fund) generated for the 10,000 possible target / probe combinations was calculated. As there are 100 probes and 100 targets, there are 100 x 100 = 10,000 possible different possible interactions of which 100 are the result of perfect hybridizations. The remaining 9900 results from the hybridization of a target with an erroneous pairing probe. A cross hybridization event is then defined as a non-specific event whose median net fluorescence intensity exceeds 3 times the zero background of the target. In other words, only one interference calculation will be performed for any sample in which (MFIsample-MFI zero target fund) / MFI zero target fund 3. Cross hybridization events were quantified by expressing the value of the cross hybridization signal as a percentage of the perfect pairing hybridization signal with the same probe.

Se ilustran los resultados obtenidos en la figura 3. Se muestra la capacidad de cada diana para reconocerse específicamente por su sonda de apareamiento. De los posibles 9900 acontecimientos de hibridación no específica que podrían haber sucedido cuando se expusieron cada una de las 100 dianas a la combinación de 100 sondas, se observaron 6 acontecimientos. De estos 6 acontecimientos, el mayor acontecimiento no específico generó una señal equivalente al 5,3% de la señal observada para el par de apareamiento perfecto (es decir, acontecimiento de hibridación específica). The results obtained in Figure 3 are illustrated. The ability of each target to be specifically recognized by its pairing probe is shown. Of the possible 9900 non-specific hybridization events that could have occurred when each of the 100 targets were exposed to the combination of 100 probes, 6 events were observed. Of these 6 events, the largest non-specific event generated a signal equivalent to 5.3% of the observed signal for the perfect pairing pair (ie, specific hybridization event).

Por tanto, se examinó cada una de las 100 dianas individualmente para determinar la hibridación específica con su secuencia complementaria incorporada sobre una microesfera, así como para determinar la hibridación no específica con los complementos de las otras 99 secuencias diana. Se muestran resultados de hibridación representativos para la diana (complemento de la sonda 90, tabla I) en la figura 4. Se encontró que la sonda 90 se Therefore, each of the 100 targets was examined individually to determine specific hybridization with its complementary sequence incorporated on a microsphere, as well as to determine non-specific hybridization with the complements of the other 99 target sequences. Representative hybridization results for the target (complement of probe 90, table I) are shown in Figure 4. It was found that probe 90 is

5 hibridaba sólo con su diana de apareamiento perfecto. No se observó hibridación cruzada con ninguna de las otras 99 dianas. 5 hybridized only with its perfect mating target. No cross hybridization was observed with any of the other 99 targets.

Los resultados anteriores demuestran la posibilidad de incorporar las 1168 secuencias de la tabla I, o cualquier subconjunto de las mismas, en un sistema multiplexado con las expectativas de que la mayoría si no todas las The previous results demonstrate the possibility of incorporating the 1168 sequences of table I, or any subset of them, in a multiplexed system with the expectations that most if not all

10 secuencias puedan distinguirse de las demás mediante hibridación. Es decir, es posible distinguir cada diana de las demás dianas mediante hibridación de la diana con su complemento preciso e hibridación mínima con complementos de las demás dianas. 10 sequences can be distinguished from the others by hybridization. That is, it is possible to distinguish each target from the other targets by hybridization of the target with its precise complement and minimal hybridization with supplements of the other targets.

EJEMPLO 2 - Secuencias de etiqueta utilizadas en la clasificación de polinucleótidos EXAMPLE 2 - Label sequences used in the polynucleotide classification

15 La familia de etiquetas de secuencia sin hibridación cruzada o un subconjunto de las mismas puede unirse a secuencias de sonda de oligonucleótido durante la síntesis y utilizarse para generar secuencias de sonda amplificadas. Con el fin de someter a prueba la viabilidad de la amplificación por PCR con etiquetas de secuencia sin hibridación cruzada y posteriormente dirigir cada secuencia respectiva hasta su ubicación apropiada en The family of sequence tags without cross-hybridization or a subset thereof can be linked to oligonucleotide probe sequences during synthesis and used to generate amplified probe sequences. In order to test the viability of PCR amplification with sequence tags without cross hybridization and subsequently direct each respective sequence to its appropriate location in

20 alineamientos bidimensionales o de perlas, se concibió el siguiente experimento. Puede conectarse una secuencia de etiqueta de 24 meros de manera específica 5’-3’ a una secuencia específica de exón p53 (cebador inverso de 20 meros). La secuencia de p53 de conexión representa el complemento inverso de la secuencia génica de nucleótidos. Para facilitar la posterior generación de ADN monocatenario tras la amplificación puede sintetizarse el etiquetacebador inverso con una modificación de fosfato (PO4) en el extremo 5’. También puede generarse un segundo 20 two-dimensional or pearl alignments, the following experiment was conceived. A 24-mer tag sequence specifically 5’-3 ’can be connected to a specific p53 exon sequence (20-mer reverse primer). The connection p53 sequence represents the inverse complement of the nucleotide gene sequence. To facilitate the subsequent generation of single stranded DNA after amplification, the reverse tagger can be synthesized with a phosphate modification (PO4) at the 5 ’end. A second can also be generated.

25 cebador de PCR para cada exón deseado, representado por el cebador de amplificación directo (5’-3’). En este caso, el cebador directo puede marcarse con una modificación de 5’-biotina para permitir la detección con Cy3avidina o equivalente. 25 PCR primer for each desired exon, represented by the direct amplification primer (5’-3 ’). In this case, the direct primer can be labeled with a 5′-biotin modification to allow detection with Cy3avidin or equivalent.

Un ejemplo práctico de la descripción mencionada anteriormente es tal como sigue: para el exón 1 de la secuencia 30 del gen supresor de tumores p53, puede generarse el siguiente etiqueta-cebador inverso (SEC ID nº:1171): A practical example of the description mentioned above is as follows: for exon 1 of sequence 30 of the p53 tumor suppressor gene, the following inverse primer-tag can be generated (SEQ ID NO: 1171):

Secuencia de etiqueta nº 3 Inverso de exón 1 Tag sequence # 3 Inverse of exon 1

La numeración anterior, el cebador inverso de exón 1 representa las posiciones genómicas de nucleótido en las bases indicadas. La correspondiente secuencia de cebador directo de exón 1 (SEC ID nº:1172) es tal como sigue: The above numbering, the exon 1 reverse primer represents the genomic nucleotide positions in the indicated bases. The corresponding direct primer sequence of exon 1 (SEQ ID NO: 1172) is as follows:

En combinación, estos cebadores amplificarán un producto de 214 pb más una extensión de etiqueta de 24 pb produciendo un tamaño total de 238 pb. In combination, these primers will amplify a 214 bp product plus a 24 bp label extension producing a total size of 238 bp.

45 Una vez amplificado, puede purificarse el producto de PCR utilizando un kit de purificación de PCR QIAquick y puede cuantificarse el ADN resultante. Para generar ADN monocatenario, se somete el ADN a digestión con λexonucleasa dando como resultado de ese modo la exposición de una secuencia monocatenaria (anti-etiqueta) complementaria a la secuencia de etiqueta unida covalentemente al alineamiento de fase sólida. Se calienta el producto resultante hasta 95ºC durante 5 minutos y luego se aplica directamente al alineamiento a una Once amplified, the PCR product can be purified using a QIAquick PCR purification kit and the resulting DNA can be quantified. To generate single stranded DNA, the DNA is digested with λexonuclease resulting in the exposure of a single stranded (anti-tag) sequence complementary to the tag sequence covalently linked to solid phase alignment. The resulting product is heated to 95 ° C for 5 minutes and then applied directly to the alignment at a

50 concentración de 10-50 nM. Tras la hibridación y clasificación concurrente, se visualizan las secuencias de etiquetaexón 1 utilizando Cy3-estreptavidina. Además de la visualización directa del producto biotinilado, el propio producto puede actuar ahora como sustrato para el análisis adicional de la región amplificada, tal como detección de SNP y determinación del haplotipo. 50 concentration of 10-50 nM. After hybridization and concurrent classification, exon 1 tag sequences are visualized using Cy3-streptavidin. In addition to direct visualization of the biotinylated product, the product itself can now act as a substrate for further analysis of the amplified region, such as SNP detection and haplotype determination.

55 Definiciones 55 Definitions

Sin hibridación cruzada: describe la ausencia de hibridación entre dos secuencias que no son complementos perfectos la una de la otra. No cross hybridization: describes the absence of hybridization between two sequences that are not perfect complements of each other.

Hibridación cruzada: los enlaces de hidrógeno de una secuencia de ADN monocatenaria que es parcialmente complementaria, pero no totalmente, a un sustrato monocatenario. Cross hybridization: the hydrogen bonds of a single stranded DNA sequence that is partially complementary, but not totally, to a single stranded substrate.

5 Homología o similitud: cómo de estrechamente relacionadas están entre sí dos o más cadenas separadas de ADN, basándose en sus secuencias de bases. 5 Homology or similarity: how closely two or more separate strands of DNA are related to each other, based on their base sequences.

Análogo: los símbolos A, G, T/U, C toman su significado habitual en la técnica en la presente memoria. En el caso de T y U, un experto en la materia entendería que éstas son equivalentes entre sí con respecto a las propiedades de 10 unión del enlace de hidrógeno intercatenario (Watson-Crick) en juego en el contexto de esta invención. Las dos bases son, por tanto, intercambiables y de ahí la designación de T/U. Un compuesto químico, que se asemeja a una base de nucleótido es un análogo de la misma. Una base que no aparece normalmente en el ADN pero que puede sustituir las que sí lo hacen, a pesar de diferencias menores en la estructura. Análogos particularmente útiles en esta invención son los de bases que se producen de manera natural que pueden insertarse en sus respectivos lugares Analogous: the symbols A, G, T / U, C take their usual meaning in the art herein. In the case of T and U, one skilled in the art would understand that these are equivalent to each other with respect to the bonding properties of the intercatenary hydrogen bond (Watson-Crick) at play in the context of this invention. The two bases are therefore interchangeable and hence the designation of T / U. A chemical compound, which resembles a nucleotide base is an analogue thereof. A base that does not normally appear in the DNA but can replace those that do, despite minor differences in structure. Particularly useful analogs in this invention are those of naturally occurring bases that can be inserted in their respective places

15 cuando se desee. Un análogo de este tipo es cualquier base no natural, tal como ácidos nucleicos peptídicos y similares que experimentan apareamiento normal de Watson-Crick de la misma manera que la base de nucleótido que se produce de manera natural a la que corresponde. 15 when desired. Such an analog is any unnatural base, such as peptide nucleic acids and the like that undergo normal Watson-Crick mating in the same manner as the naturally occurring nucleotide base to which it corresponds.

Complemento: la imagen opuesta o “especular” de una secuencia de ADN. Una secuencia de ADN complementaria 20 presenta una “A” para cada “T” y una “C” para cada “G”. Dos cadenas complementarias de ADN monocatenario, por ejemplo una secuencia de etiqueta y su complemento, se unirán para formar una molécula bicatenaria. Complement: the opposite or "specular" image of a DNA sequence. A complementary DNA sequence 20 has an "A" for each "T" and a "C" for each "G". Two complementary strands of single stranded DNA, for example a tag sequence and its complement, will join to form a double stranded molecule.

ADN complementario (ADNc): ADN que se sintetiza a partir de un molde de ARN mensajero; la forma monocatenaria se utiliza a menudo como sonda en mapeo físico. Complementary DNA (cDNA): DNA that is synthesized from a messenger RNA template; The single-stranded form is often used as a probe in physical mapping.

25 Oligonucleótido: se refiere a un polímero corto de nucleótidos mediante el cual los nucleótidos pueden ser bases de nucleótido naturales o análogos de las mismas. Oligonucleotide: refers to a short nucleotide polymer by which the nucleotides can be natural nucleotide bases or analogs thereof.

Etiqueta: se refiere a un oligonucleótido que puede utilizarse para clasificar específicamente analitos con al menos 30 otro oligonucleótido que cuando se utilizan juntos no presentan hibridación cruzada. Label: refers to an oligonucleotide that can be used to specifically classify analytes with at least 30 other oligonucleotides that when used together do not exhibit cross hybridization.

Tabla I Table I

Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. one

Secuencia SEC ID nº: N.º en ej. 1 Secuencia SEC ID nº: N.º en ej. 1 Sequence SEQ ID NO: No. in ex. 1 Sequence SEQ ID NO: No. in ex. one

Secuencia SEC ID nº: N.º en ej. 1 Sequence SEQ ID NO: No. in ex. one

Toda la bibliografía a la que se hace referencia en esta memoria descriptiva se incorpora como referencia a la presente memoria. All the bibliography referred to in this specification is incorporated as a reference to this report.

5 El alcance de protección buscado para la invención descrita en la presente memoria está definido por las reivindicaciones adjuntas. También se entenderá que cualquier elemento citado anteriormente o en las reivindicaciones, puede combinarse con los elementos de cualquier reivindicación. En particular, pueden combinarse elementos de una reivindicación dependiente con cualquier elemento de una reivindicación de la que dependa, o con cualquier otro elemento compatible de la invención. The scope of protection sought for the invention described herein is defined by the appended claims. It will also be understood that any element mentioned above or in the claims may be combined with the elements of any claim. In particular, elements of a dependent claim can be combined with any element of a claim on which it depends, or with any other compatible element of the invention.

10 Esta solicitud reivindica la prioridad de las solicitudes provisionales de patente US nº 60/263.710 y nº 60/303.799, presentadas el 25 de enero de 2001 y el 10 de julio de 2001. Estos dos documentos se incorporan como referencia a la presente memoria. 10 This application claims the priority of provisional US patent applications No. 60 / 263,710 and No. 60 / 303,799, filed on January 25, 2001 and July 10, 2001. These two documents are incorporated by reference herein.

Claims (30)

REIVINDICACIONES 1. Composición que comprende una pluralidad de complementos de etiqueta de oligonucleótido que presentan hibridación cruzada mínima, en la que: 1. Composition comprising a plurality of oligonucleotide tag complements that exhibit minimal cross hybridization, in which:
(a) (to)
cada oligonucleótido está libre de residuos o bien de citosina o bien de guanina, each oligonucleotide is free of residues either of cytosine or guanine,
(b) (b)
no hay dos residuos de citosina o de guanina situados adyacentes entre sí en un oligonucleótido y dos residuos de citosina o de guanina cualesquiera están separados como máximo por 6 residuos distintos de citosina o distintos de guanina, respectivamente, no two cytosine or guanine residues located adjacent to each other in an oligonucleotide and any two cytosine or guanine residues are separated by a maximum of 6 different cytosine or non-guanine residues, respectively,
(c) (C)
el número de residuos de citosina o de guanina en cada oligonucleótido no supera L/4 en el que L es el número de bases en el oligonucleótido, the number of cytosine or guanine residues in each oligonucleotide does not exceed L / 4 in which L is the number of bases in the oligonucleotide,
(d) (d)
la longitud de cada oligonucleótido se diferencia en no más de cinco bases de la longitud media de todos los oligonucleótidos en la composición, the length of each oligonucleotide differs by no more than five bases from the average length of all oligonucleotides in the composition,
(e) (and)
cada oligonucleótido no contiene 4 o más nucleótidos idénticos contiguos, each oligonucleotide does not contain 4 or more contiguous identical nucleotides,
(f) (F)
el número de residuos de guanina o de citosina en cada oligonucleótido no varía del número medio de residuos de guanina o de citosina en todos los demás oligonucleótidos de la composición en más de uno, the number of guanine or cytosine residues in each oligonucleotide does not vary from the average number of guanine or cytosine residues in all other oligonucleotides of the composition in more than one,
(g) (g)
cada complemento de etiqueta contiene un residuo de guanina o un residuo de citosina respectivamente, dentro de siete residuos de un extremo del oligonucleótido, each tag complement contains a guanine residue or a cytosine residue respectively, within seven residues of one end of the oligonucleotide,
(h) (h)
cuando cada complemento de etiqueta de oligonucleótido se expone a condiciones de hibridación que comprenden NaCl 0,2 M, Tris 0,1 M, Triton X-100 al 0,08%, pH 8,0 a 37ºC, el grado máximo de hibridación entre el complemento de etiqueta y una etiqueta que no es totalmente complementaria al complemento de etiqueta no supera el 30% del grado de hibridación entre el complemento de etiqueta y su etiqueta totalmente complementaria; y when each oligonucleotide tag complement is exposed to hybridization conditions comprising 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8.0 at 37 ° C, the maximum degree of hybridization between the label complement and a label that is not completely complementary to the label complement does not exceed 30% of the degree of hybridization between the label complement and its completely complementary label; Y
(i) (i)
en la que cada oligonucleótido presenta entre 18 y 30 nucleótidos de longitud. in which each oligonucleotide is between 18 and 30 nucleotides in length.
2. 2.
Composición según la reivindicación 1, en la que cada oligonucleótido está libre de residuos de citosina. Composition according to claim 1, wherein each oligonucleotide is free of cytosine residues.
3. 3.
Composición según cualquiera de las reivindicaciones anteriores, en la que cuando cada complemento de etiqueta de oligonucleótido se expone a condiciones de hibridación que comprenden NaCl 0,2 M, Tris 0,1 M, Triton X-100 al 0,08%, pH 8,0 a 37ºC, el grado máximo de hibridación entre el complemento de etiqueta y una etiqueta que no es totalmente complementaria al complemento de etiqueta no supera el 25% del grado de hibridación entre el complemento de etiqueta y su etiqueta totalmente complementaria. Composition according to any of the preceding claims, wherein when each oligonucleotide tag complement is exposed to hybridization conditions comprising 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8 , 0 to 37 ° C, the maximum degree of hybridization between the label complement and a label that is not completely complementary to the label complement does not exceed 25% of the degree of hybridization between the label complement and its completely complementary label.
4. Four.
Composición según cualquiera de las reivindicaciones anteriores, en la que cuando cada complemento de etiqueta de oligonucleótido se expone a condiciones de hibridación que comprenden NaCl 0,2 M, Tris 0,1 M, Triton X-100 al 0,08%, pH 8,0 a 37ºC, el grado máximo de hibridación entre el complemento de etiqueta y una etiqueta que no es totalmente complementaria al complemento de etiqueta no supera el 20% del grado de hibridación entre el complemento de etiqueta y su etiqueta totalmente complementaria. Composition according to any of the preceding claims, wherein when each oligonucleotide tag complement is exposed to hybridization conditions comprising 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8 , 0 to 37 ° C, the maximum degree of hybridization between the label complement and a label that is not completely complementary to the label complement does not exceed 20% of the degree of hybridization between the label complement and its completely complementary label.
5. 5.
Composición según cualquiera de las reivindicaciones anteriores, en la que cuando cada complemento de etiqueta de oligonucleótido se expone a condiciones de hibridación que comprenden NaCl 0,2 M, Tris 0,1 M, Triton X-100 al 0,08%, pH 8,0 a 37ºC, el grado máximo de hibridación entre el complemento de etiqueta y una etiqueta que no es totalmente complementaria al complemento de etiqueta no supera el 15% del grado de hibridación entre el complemento de etiqueta y su etiqueta totalmente complementaria. Composition according to any of the preceding claims, wherein when each oligonucleotide tag complement is exposed to hybridization conditions comprising 0.2 M NaCl, 0.1 M Tris, 0.08% Triton X-100, pH 8 , 0 to 37 ° C, the maximum degree of hybridization between the label complement and a label that is not completely complementary to the label complement does not exceed 15% of the degree of hybridization between the label complement and its completely complementary label.
6. 6.
Composición según cualquiera de las reivindicaciones anteriores, en la que la longitud de cada oligonucleótido en la composición es idéntica. Composition according to any of the preceding claims, wherein the length of each oligonucleotide in the composition is identical.
7. 7.
Composición según cualquiera de las reivindicaciones anteriores, en la que el número de residuos de guanina o de citosina en cada oligonucleótido es el mismo. Composition according to any of the preceding claims, wherein the number of guanine or cytosine residues in each oligonucleotide is the same.
8. 8.
Composición según cualquiera de las reivindicaciones anteriores, en la que cada oligonucleótido presenta entre 22 y 26 nucleótidos de longitud. Composition according to any of the preceding claims, wherein each oligonucleotide is between 22 and 26 nucleotides in length.
9. 9.
Composición según cualquiera de las reivindicaciones anteriores, en la que cada oligonucleótido comprende 24 residuos. Composition according to any of the preceding claims, wherein each oligonucleotide comprises 24 residues.
10. 10.
Composición según la reivindicación 9, en la que cada oligonucleótido contiene 6 residuos de guanina o de Composition according to claim 9, wherein each oligonucleotide contains 6 guanine residues or
citosina. cytosine
11. eleven.
Composición según cualquiera de las reivindicaciones anteriores, en la que los complementos de etiqueta están fijados a un soporte de fase sólida. Composition according to any of the preceding claims, wherein the label complements are fixed to a solid phase support.
12. 12.
Composición según la reivindicación 11, en la que el soporte es un sustrato plano que comprende una pluralidad de regiones espacialmente direccionables. Composition according to claim 11, wherein the support is a flat substrate comprising a plurality of spatially addressable regions.
13. 13.
Composición según la reivindicación 11, en la que los complementos de etiqueta están covalentemente unidos a micropartículas. Composition according to claim 11, wherein the label complements are covalently bound to microparticles.
14. 14.
Composición según cualquiera de las reivindicaciones anteriores, en la que la composición comprende 150 complementos de etiqueta. Composition according to any of the preceding claims, wherein the composition comprises 150 label complements.
15. fifteen.
Composición según cualquiera de las reivindicaciones anteriores, que comprende ciento sesenta complementos de etiqueta, o que comprende ciento setenta complementos de etiqueta, o que comprende ciento ochenta complementos de etiqueta, o que comprende ciento noventa complementos de etiqueta, o que comprende doscientos complementos de etiqueta, o que comprende doscientos veinte complementos de etiqueta, o que comprende doscientos cuarenta complementos de etiqueta, o que comprende doscientos sesenta complementos de etiqueta, o que comprende doscientos ochenta complementos de etiqueta, o que comprende trescientos complementos de etiqueta, o que comprende cuatrocientos complementos de etiqueta, o que comprende quinientos complementos de etiqueta, o que comprende seiscientos complementos de etiqueta, o que comprende setecientos complementos de etiqueta, o que comprende ochocientos complementos de etiqueta, o que comprende novecientos complementos de etiqueta, o que comprende mil complementos de etiqueta. Composition according to any one of the preceding claims, comprising one hundred and sixty label complements, or comprising one hundred and seventy label complements, or comprising one hundred and eighty label complements, or comprising one hundred and ninety label complements, or comprising two hundred label complements. , or comprising two hundred and twenty label complements, or comprising two hundred and forty label complements, or comprising two hundred and sixty label complements, or comprising two hundred and eighty label complements, or comprising three hundred label complements, or comprising four hundred complements of label, or comprising five hundred label complements, or comprising six hundred label complements, or comprising seven hundred label complements, or comprising eight hundred label complements, or comprising nine hundred label complements, or comprising one thousand complement s tag.
16. 16.
Kit para clasificar e identificar polinucleótidos que comprende uno o más soportes de fase sólida que comprenden una pluralidad de regiones espacialmente diferenciadas, presentando cada región una población uniforme de complementos de etiqueta sustancialmente idénticos covalentemente fijados a la misma y seleccionándose cada uno de los complementos de etiqueta a partir de una composición de oligonucleótidos que presentan hibridación cruzada mínima según cualquiera de las reivindicaciones 1 a 15. Kit for classifying and identifying polynucleotides comprising one or more solid phase supports comprising a plurality of spatially differentiated regions, each region presenting a uniform population of substantially identical label complements covalently attached thereto and each label complement being selected from an oligonucleotide composition exhibiting minimal cross hybridization according to any one of claims 1 to 15.
17. 17.
Kit según la reivindicación 16, en el que uno o más soportes de fase sólida son un sustrato plano y en el que una Kit according to claim 16, wherein one or more solid phase supports are a flat substrate and wherein a
o más regiones espacialmente diferenciadas son una pluralidad de regiones espacialmente direccionables. or more spatially differentiated regions are a plurality of spatially addressable regions.
18. 18.
Kit según la reivindicación 16, en el que uno o más soportes de fase sólida son una pluralidad de micropartículas. Kit according to claim 16, wherein one or more solid phase supports are a plurality of microparticles.
19. 19.
Kit según la reivindicación 18, en el que dichas micropartículas presentan cada una un diámetro en el intervalo comprendido entre 5 y 40 μm. Kit according to claim 18, wherein said microparticles each have a diameter in the range between 5 and 40 µm.
20. twenty.
Kit según la reivindicación 18 o 19, en el que cada micropartícula es espectrofotométricamente única respecto a cada otra micropartícula que presenta un oligonucleótido diferente unido a la misma. Kit according to claim 18 or 19, wherein each microparticle is spectrophotometrically unique with respect to each other microparticle having a different oligonucleotide attached thereto.
21. twenty-one.
Procedimiento de análisis de una muestra biológica que comprende una pluralidad de moléculas de ácido nucleico para determinar la presencia de una mutación o polimorfismo en un locus de cada molécula de ácido nucleico, para cada molécula de ácido nucleico, comprendiendo el procedimiento: (a) hibridar la molécula y un cebador, presentando el cebador una secuencia en 5’ que presenta la secuencia de una etiqueta complementaria a la secuencia de un complemento de etiqueta que pertenece a una familia de complementos de etiqueta según cualquiera de las reivindicaciones 1 a 15 y un extremo 3’ que se extiende de manera inmediatamente adyacente al locus; (b) extender enzimáticamente el extremo 3’ del cebador en presencia de una pluralidad de derivados de nucleósido trifosfato cada uno de los cuales: (i) puede incorporarse enzimáticamente en el extremo 3’ de una cadena de nucleótidos en crecimiento; (ii) provoca la terminación de dicha extensión; y (iii) puede detectarse de manera diferencial, entre sí, en el que uno de dichos derivados es complementario a cada posible nucleótido presente en dicho locus; (c) hibridar específicamente el cebador extendido formado en la etapa (b) con un complemento de etiqueta que presenta la secuencia de complemento de etiqueta de (a); y (d) detectar el derivado de nucleótido incorporado en el cebador en la etapa (b) para identificar la base situada en el locus de la molécula de ácido nucleico; en el que cada etiqueta de (a) es única para cada molécula de ácido nucleico y las etapas (a) y (b) se llevan a cabo con dichas moléculas nucleicas una en presencia de otra. Method of analysis of a biological sample comprising a plurality of nucleic acid molecules to determine the presence of a mutation or polymorphism in a locus of each nucleic acid molecule, for each nucleic acid molecule, the method comprising: (a) hybridizing the molecule and a primer, the primer presenting a 5 'sequence presenting the sequence of a tag complementary to the sequence of a tag complement belonging to a family of tag complements according to any one of claims 1 to 15 and one end 3 'extending immediately adjacent to the locus; (b) enzymatically extending the 3 ′ end of the primer in the presence of a plurality of nucleoside triphosphate derivatives each of which: (i) can be enzymatically incorporated into the 3 ′ end of a growing nucleotide chain; (ii) causes the termination of said extension; and (iii) it can be detected in a differential manner, with one another, in which one of said derivatives is complementary to each possible nucleotide present in said locus; (c) specifically hybridize the extended primer formed in step (b) with a tag complement that has the tag complement sequence of (a); and (d) detecting the nucleotide derivative incorporated in the primer in step (b) to identify the base located at the locus of the nucleic acid molecule; wherein each label of (a) is unique to each nucleic acid molecule and steps (a) and (b) are carried out with said nucleic molecules in the presence of another.
22. 22
Procedimiento según la reivindicación 21, en el que cada complemento respectivo está unido como una población uniforme de complementos sustancialmente idénticos en una región espacialmente diferenciada en uno o más de dichos soportes de fase sólida. Method according to claim 21, wherein each respective complement is linked as a uniform population of substantially identical complements in a spatially differentiated region on one or more of said solid phase supports.
23. 2. 3.
Procedimiento según la reivindicación 21, en el que cada uno de dichos complementos de etiqueta comprende un marcador, siendo cada uno de dichos marcadores diferente para los complementos respectivos, y la etapa (d) incluye detectar la presencia de los diferentes marcadores para complejos de hibridación respectivos de etiquetas y complementos de etiqueta unidos. Method according to claim 21, wherein each of said label complements comprises a marker, each of said markers being different for the respective complements, and step (d) includes detecting the presence of the different markers for hybridization complexes. respective labels and tag add-ons attached.
24. 24.
Procedimiento de determinación de la presencia de una diana que se sospecha que está contenida en una mezcla, comprendiendo el procedimiento las etapas siguientes: (i) marcar la diana con un primer marcador; (ii) proporcionar un primer resto de detección que puede unirse específicamente a la diana y que incluye una primera etiqueta; (iii) exponer una muestra de la mezcla al resto de detección en condiciones aptas para permitir dicha unión específica del resto y la diana; (iv) proporcionar una familia de complementos de etiqueta según cualquiera de las reivindicaciones 1 a 15, conteniendo la familia un primer complemento de etiqueta que presenta una secuencia complementaria a la de la primera etiqueta; (v) exponer la muestra a la familia de complementos de etiqueta en condiciones aptas para permitir la hibridación específica de la primera etiqueta y su complemento de etiqueta; (vi) determinar si dicho primer resto de detección hibridado a un primer dicho complemento de etiqueta está unido a dicha diana marcada para determinar la presencia o ausencia de dicha diana en la mezcla. Procedure for determining the presence of a target that is suspected of being contained in a mixture, the procedure comprising the following steps: (i) marking the target with a first marker; (ii) provide a first detection moiety that can specifically bind to the target and that includes a first tag; (iii) exposing a sample of the mixture to the detection residue under conditions suitable to allow said specific binding of the residue and the target; (iv) providing a family of tag complements according to any one of claims 1 to 15, the family containing a first tag compliment having a sequence complementary to that of the first tag; (v) expose the sample to the family of label complements under conditions suitable to allow specific hybridization of the first label and its label complement; (vi) determining whether said first detection residue hybridized to a first said label complement is attached to said labeled target to determine the presence or absence of said target in the mixture.
25. 25.
Procedimiento según la reivindicación 24, en el que dicho primer complemento de etiqueta está unido a un soporte sólido en una ubicación específica del soporte y la etapa (vi) incluye detectar la presencia del primer marcador en dicha ubicación específica. Method according to claim 24, wherein said first label complement is attached to a solid support at a specific location of the support and step (vi) includes detecting the presence of the first marker at said specific location.
26. 26.
Procedimiento según la reivindicación 24 o 25, en el que dicho primer complemento de etiqueta comprende un segundo marcador y la etapa (vi) incluye detectar la presencia del primer y segundo marcadores en un complejo hibridado del resto y el primer complemento de etiqueta. Method according to claim 24 or 25, wherein said first label complement comprises a second label and step (vi) includes detecting the presence of the first and second markers in a hybridized complex of the rest and the first label complement.
27. 27.
Procedimiento según cualquiera de las reivindicaciones 24 a 26, en el que dicha diana se selecciona de entre el grupo constituido por moléculas orgánicas, antígenos, proteínas, polipéptidos, anticuerpos y ácidos nucleicos. Method according to any of claims 24 to 26, wherein said target is selected from the group consisting of organic molecules, antigens, proteins, polypeptides, antibodies and nucleic acids.
28. 28.
Procedimiento según cualquiera de las reivindicaciones 24 a 27, en el que dicha diana es un antígeno y dicha primera molécula es un anticuerpo específico para dicho antígeno. Method according to any of claims 24 to 27, wherein said target is an antigen and said first molecule is an antibody specific for said antigen.
29. 29.
Procedimiento según cualquiera de las reivindicaciones 24 a 28, en el que el antígeno es un polipéptido o una proteína y la etapa de marcaje incluye la conjugación de moléculas fluorescentes, digoxigenina, biotinilación y similares. Method according to any of claims 24 to 28, wherein the antigen is a polypeptide or a protein and the labeling step includes the conjugation of fluorescent molecules, digoxigenin, biotinylation and the like.
30. 30
Procedimiento según cualquiera de las reivindicaciones 24 a 27, en el que dicha diana es un ácido nucleico y la etapa de marcaje incluye la incorporación de moléculas fluorescentes, nucleótido radiomarcado, digoxigenina, biotinilación y similares. Method according to any of claims 24 to 27, wherein said target is a nucleic acid and the labeling step includes the incorporation of fluorescent molecules, radiolabeled nucleotide, digoxigenin, biotinylation and the like.
ES02709941T 2001-01-25 2002-01-25 Polynucleotides for use as labels and tag complements, manufacture and use thereof Expired - Lifetime ES2382542T3 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US26371001P 2001-01-25 2001-01-25
US263710P 2001-01-25
US30379901P 2001-07-10 2001-07-10
US303799P 2001-07-10
PCT/CA2002/000089 WO2002059355A2 (en) 2001-01-25 2002-01-25 Polynucleotides for use as tags and tag complements, manufacture and use thereof

Publications (1)

Publication Number Publication Date
ES2382542T3 true ES2382542T3 (en) 2012-06-11

Family

ID=26950006

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02709941T Expired - Lifetime ES2382542T3 (en) 2001-01-25 2002-01-25 Polynucleotides for use as labels and tag complements, manufacture and use thereof

Country Status (10)

Country Link
US (2) US7645868B2 (en)
EP (4) EP2327794A3 (en)
JP (3) JP4422963B2 (en)
AT (1) ATE546545T1 (en)
AU (3) AU2002227829C1 (en)
BR (2) BRPI0206746B8 (en)
CA (2) CA2435612C (en)
DK (1) DK1364065T3 (en)
ES (1) ES2382542T3 (en)
WO (2) WO2002059354A2 (en)

Families Citing this family (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4422963B2 (en) * 2001-01-25 2010-03-03 ルミネックス モレキュラー ダイアグノスティックス, インク. Non-cross-hybridized polynucleotide families, products for use as labels and labeled complements, and methods of use thereof
US7226737B2 (en) * 2001-01-25 2007-06-05 Luminex Molecular Diagnostics, Inc. Polynucleotides for use as tags and tag complements, manufacture and use thereof
US20110151438A9 (en) 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
DE60231543D1 (en) 2001-11-19 2009-04-23 Parallele Bioscience Inc MULTIPLEX OLIGONUCLEOTIDE ADDITION AND TARGET AMPLIFICATION
GB0308852D0 (en) * 2003-04-16 2003-05-21 Lingvitae As Method
CA2546171A1 (en) 2003-11-17 2005-05-26 Tm Bioscience Corporation Method of detecting mutations associated with thrombosis
CA2568499A1 (en) * 2004-06-01 2005-12-15 Tm Bioscience Corporation Method of detecting cystic fibrosis associated mutations
WO2006002525A1 (en) * 2004-06-30 2006-01-12 Tm Bioscience Pgx, Inc. Method of detecting mutations in the gene encoding cytochrome p450-2c9
JP2008504826A (en) * 2004-06-30 2008-02-21 ティーエム バイオサイエンス ピージーエクス インコーポレイティッド Method for detecting a mutation in a gene encoding cytochrome P450-2D6
EP1778868A4 (en) * 2004-07-30 2007-12-12 Tm Bioscience Pgx Inc Method of detecting mutations in the gene encoding cytochrome p450-2c19
WO2007025594A1 (en) * 2005-07-07 2007-03-08 Pamgene Bv Method for detection and quantification of target nucleic acids in a sample
US7807359B2 (en) * 2006-12-01 2010-10-05 Quest Diagnostics Investments Incorporated Methods of detecting TPMT mutations
US7955802B2 (en) 2006-12-13 2011-06-07 Luminex Corporation Systems and methods for multiplex analysis of PCR in real time
US20090148849A1 (en) * 2007-11-02 2009-06-11 Barbara Galvan-Goldman One-step target detection assay
EP2218019A4 (en) * 2007-11-02 2012-04-18 Hunch Inc Interactive machine learning advice facility
US8008019B2 (en) * 2007-11-28 2011-08-30 Luminex Molecular Diagnostics Use of dual-tags for the evaluation of genomic variable repeat regions
US8039794B2 (en) 2008-12-16 2011-10-18 Quest Diagnostics Investments Incorporated Mass spectrometry assay for thiopurine-S-methyl transferase activity and products generated thereby
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
WO2011008530A2 (en) 2009-06-29 2011-01-20 Luminex Corporation Chimeric primers with hairpin conformations and methods of using same
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
KR101866401B1 (en) 2010-04-05 2018-06-11 프로그노시스 바이오사이언스, 인코포레이티드 Spatially encoded biological assays
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
CN102010900B (en) * 2010-06-08 2013-04-24 广州益善生物技术有限公司 Liquid chip and specific primer for detecting SNP of GPIIIa gene and liquid chip and specific primer for detecting SNP of GPIIIa and COX-1 genes
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
HUE068153T2 (en) 2011-04-15 2024-12-28 Univ Johns Hopkins Safe sequencing system
US20130085078A1 (en) 2011-09-29 2013-04-04 Luminex Corporation Hydrolysis Probes
ES2663234T3 (en) 2012-02-27 2018-04-11 Cellular Research, Inc Compositions and kits for molecular counting
CN103374601A (en) * 2012-04-11 2013-10-30 广州益善生物技术有限公司 Specific primers and liquid-phase chip for chromosome 5p15 region SNP detection
CN103374598A (en) * 2012-04-11 2013-10-30 广州益善生物技术有限公司 Specific primers and liquid-phase chip for HLA-A gene mutation detection
CN103374605A (en) * 2012-04-12 2013-10-30 广州益善生物技术有限公司 ATR (ataxia telangiectasia-mutated and Rad3-related) gene mutation detection specific primers and liquid chip
CN103374606B (en) * 2012-04-12 2015-04-22 益善生物技术股份有限公司 CHEK1 (checkpoint kinase 1) gene mutation detection specific primers and liquid chip
CN103374610A (en) * 2012-04-12 2013-10-30 广州益善生物技术有限公司 CHRNA3 (cholinergic receptor, nicotinic, alpha 3) gene mutation detection specific primers and liquid chip
CN103451274A (en) * 2012-05-31 2013-12-18 益善生物技术股份有限公司 CHRNA5 gene mutation detection specific primer and liquid phase chip
CN103451272A (en) * 2012-05-31 2013-12-18 益善生物技术股份有限公司 BAT3 gene mutation detection specific primer and liquid phase chip
US9663818B2 (en) 2012-06-15 2017-05-30 The University Of Chicago Oligonucleotide-mediated quantitative multiplexed immunoassays
CN103571931A (en) * 2012-07-18 2014-02-12 益善生物技术股份有限公司 Specific primers and liquid chip for EHBP1 (EH domain binding protein 1) gene mutation detection
CN103571918A (en) * 2012-07-18 2014-02-12 益善生物技术股份有限公司 Specific detection primers and detection liquid phase chip for FYCO1 gene mutation
CN103571917A (en) * 2012-07-18 2014-02-12 益善生物技术股份有限公司 Specific detection primers and detection liquid phase chip for ADH1B gene mutation
EP3511423B2 (en) 2012-10-17 2024-05-29 Spatial Transcriptomics AB Methods and product for optimising localised or spatial detection of gene expression in a tissue sample
ES2701742T3 (en) 2012-10-29 2019-02-25 Univ Johns Hopkins Papanicolaou test for ovarian and endometrial cancers
CN103849942B (en) * 2012-12-04 2016-07-13 益善生物技术股份有限公司 TOX3 detection in Gene Mutation specific primer and liquid-phase chip
CN103849940B (en) * 2012-12-04 2016-09-14 益善生物技术股份有限公司 BARD1 detection in Gene Mutation specific primer and liquid-phase chip
CN103849943B (en) * 2012-12-04 2016-08-03 益善生物技术股份有限公司 MC1R detection in Gene Mutation specific primer and liquid-phase chip
CN103849938B (en) * 2012-12-04 2016-08-03 益善生物技术股份有限公司 MAP3K1 detection in Gene Mutation specific primer and liquid-phase chip
CN103849939B (en) * 2012-12-04 2016-06-22 益善生物技术股份有限公司 RAD51L1 detection in Gene Mutation specific primer and liquid-phase chip
CN103849941B (en) * 2012-12-04 2016-06-01 益善生物技术股份有限公司 TYR detection in Gene Mutation Auele Specific Primer and liquid-phase chip
WO2014205083A1 (en) 2013-06-19 2014-12-24 Luminex Corporation Real-time multiplexed hydrolysis probe assay using spectrally identifiable microspheres
US9868979B2 (en) 2013-06-25 2018-01-16 Prognosys Biosciences, Inc. Spatially encoded biological assays using a microfluidic device
EP3715470B1 (en) 2013-08-09 2023-10-11 Luminex Corporation Probes for improved melt discrimination and multiplexing in nucleic acid assays
AU2014312208B2 (en) 2013-08-28 2019-07-25 Becton, Dickinson And Company Massively parallel single cell analysis
JP2017504307A (en) 2013-10-07 2017-02-09 セルラー リサーチ, インコーポレイテッド Method and system for digitally counting features on an array
MX2014003938A (en) * 2014-04-01 2015-09-30 Univ Nac Autónoma De México Microarray for the detection of enteropathogenic microorganisms in environmental and biological samples.
CN105316398A (en) * 2014-07-30 2016-02-10 益善生物技术股份有限公司 Amplification primer for detecting food-borne pathogenic microorganisms and liquid chip kit
JP6664381B2 (en) 2014-08-11 2020-03-13 ルミネックス コーポレーション Probes for improved melting discrimination and multiplexing in nucleic acid assays
CN107250379B (en) 2015-02-19 2021-12-28 贝克顿迪金森公司 High throughput single cell analysis combining proteomic and genomic information
CN107208158B (en) 2015-02-27 2022-01-28 贝克顿迪金森公司 Spatially addressable molecular barcode
US11535882B2 (en) 2015-03-30 2022-12-27 Becton, Dickinson And Company Methods and compositions for combinatorial barcoding
ES2955488T3 (en) 2015-04-10 2023-12-01 Spatial Transcriptomics Ab Multiplex analysis of biological specimens of spatially distinguished nucleic acids
EP3286326B1 (en) 2015-04-23 2025-01-22 Becton, Dickinson and Company Method for whole transcriptome amplification
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
CN108026569B (en) 2015-07-17 2021-08-24 卢米耐克斯公司 Methods and compositions for catalytic assays
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
CN108026524A (en) 2015-09-11 2018-05-11 赛卢拉研究公司 Method and composition for nucleic acid library standardization
EP3452614B1 (en) * 2016-05-02 2023-06-28 Becton, Dickinson and Company Accurate molecular barcoding
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
EP3465502B1 (en) 2016-05-26 2024-04-10 Becton, Dickinson and Company Molecular label counting adjustment methods
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
CA3034924A1 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
US10722880B2 (en) 2017-01-13 2020-07-28 Cellular Research, Inc. Hydrophilic coating of fluidic channels
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
EP3635135A1 (en) 2017-06-05 2020-04-15 Becton, Dickinson and Company Sample indexing for single cells
IL272470B1 (en) 2017-08-07 2025-04-01 Univ Johns Hopkins Methods and materials for assessing and treating cancer
EP3728636B1 (en) 2017-12-19 2024-09-11 Becton, Dickinson and Company Particles associated with oligonucleotides
EP3615085A4 (en) * 2018-02-09 2021-01-13 Ohio State Innovation Foundation Rna nanostructures, methods of making, and uses thereof
WO2019213294A1 (en) 2018-05-03 2019-11-07 Becton, Dickinson And Company High throughput multiomics sample analysis
CN118910215A (en) 2018-05-03 2024-11-08 贝克顿迪金森公司 Molecular barcoding at opposite transcript ends
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
JP7670607B2 (en) 2018-10-01 2025-04-30 ベクトン・ディキンソン・アンド・カンパニー Determination of 5' transcript sequence
WO2020097315A1 (en) 2018-11-08 2020-05-14 Cellular Research, Inc. Whole transcriptome analysis of single cells using random priming
CN113195717A (en) 2018-12-13 2021-07-30 贝克顿迪金森公司 Selective extension in single cell whole transcriptome analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP4242322B1 (en) 2019-01-23 2024-08-21 Becton, Dickinson and Company Oligonucleotides associated with antibodies
CN113454234B (en) 2019-02-14 2025-03-18 贝克顿迪金森公司 Heterozygote targeted and whole transcriptome amplification
US11965208B2 (en) 2019-04-19 2024-04-23 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
AU2020268813A1 (en) 2019-05-03 2021-12-09 Meso Scale Technologies, Llc. Kits for detecting one or more target nucleic acid analytes in a sample and methods of making and using the same
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
WO2021092386A1 (en) 2019-11-08 2021-05-14 Becton Dickinson And Company Using random priming to obtain full-length v(d)j information for immune repertoire sequencing
EP4055185A1 (en) 2019-11-08 2022-09-14 10X Genomics, Inc. Spatially-tagged analyte capture agents for analyte multiplexing
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
EP3891300B1 (en) 2019-12-23 2023-03-29 10X Genomics, Inc. Methods for spatial analysis using rna-templated ligation
US12241890B2 (en) 2019-12-23 2025-03-04 10X Genomics, Inc. Methods for generating barcoded nucleic acid molecules using fixed cells
US11649497B2 (en) 2020-01-13 2023-05-16 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and RNA
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US20210230681A1 (en) 2020-01-24 2021-07-29 10X Genomics, Inc. Methods for spatial analysis using proximity ligation
EP4471155A3 (en) 2020-01-29 2024-12-18 Becton, Dickinson and Company Barcoded wells for spatial mapping of single cells through sequencing
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US12076701B2 (en) 2020-01-31 2024-09-03 10X Genomics, Inc. Capturing oligonucleotides in spatial transcriptomics
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US12110541B2 (en) 2020-02-03 2024-10-08 10X Genomics, Inc. Methods for preparing high-resolution spatial arrays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US12129516B2 (en) 2020-02-07 2024-10-29 10X Genomics, Inc. Quantitative and automated permeabilization performance evaluation for spatial transcriptomics
US11835462B2 (en) 2020-02-11 2023-12-05 10X Genomics, Inc. Methods and compositions for partitioning a biological sample
US12281357B1 (en) 2020-02-14 2025-04-22 10X Genomics, Inc. In situ spatial barcoding
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
US12153043B2 (en) 2020-02-25 2024-11-26 Becton, Dickinson And Company Bi-specific probes to enable the use of single-cell samples as single color compensation control
US11926863B1 (en) 2020-02-27 2024-03-12 10X Genomics, Inc. Solid state single cell method for analyzing fixed biological cells
US11768175B1 (en) 2020-03-04 2023-09-26 10X Genomics, Inc. Electrophoretic methods for spatial analysis
EP4242325B1 (en) 2020-04-22 2025-01-29 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
AU2021275906A1 (en) 2020-05-22 2022-12-22 10X Genomics, Inc. Spatial analysis to detect sequence variants
EP4153775B1 (en) 2020-05-22 2024-07-24 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
AU2021283174A1 (en) 2020-06-02 2023-01-05 10X Genomics, Inc. Nucleic acid library methods
US12265079B1 (en) 2020-06-02 2025-04-01 10X Genomics, Inc. Systems and methods for detecting analytes from captured single biological particles
US12157913B2 (en) 2020-06-02 2024-12-03 Becton, Dickinson And Company Oligonucleotides and beads for 5 prime gene expression assay
CN116249785A (en) 2020-06-02 2023-06-09 10X基因组学有限公司 Spatial Transcriptomics for Antigen-Receptors
US12031177B1 (en) 2020-06-04 2024-07-09 10X Genomics, Inc. Methods of enhancing spatial resolution of transcripts
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
ES2999535T3 (en) 2020-06-10 2025-02-26 10X Genomics Inc Methods for determining a location of an analyte in a biological sample
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US12209280B1 (en) 2020-07-06 2025-01-28 10X Genomics, Inc. Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
EP4491742A3 (en) 2020-09-18 2025-05-21 10x Genomics, Inc. Sample handling apparatus and image registration methods
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
CN112553379B (en) * 2020-12-30 2022-08-19 湖北新纵科病毒疾病工程技术有限公司 Method and kit for detecting respiratory infectious disease virus based on liquid chip
EP4294571B8 (en) 2021-02-19 2024-07-10 10X Genomics, Inc. Method of using a modular assay support device
ES3008686T3 (en) 2021-03-18 2025-03-24 10X Genomics Inc Multiplex capture of gene and protein expression from a biological sample
WO2022221425A1 (en) 2021-04-14 2022-10-20 10X Genomics, Inc. Methods of measuring mislocalization of an analyte
WO2022256503A1 (en) 2021-06-03 2022-12-08 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
ES3011462T3 (en) 2021-09-01 2025-04-07 10X Genomics Inc Methods for blocking a capture probe on a spatial array
WO2023086880A1 (en) 2021-11-10 2023-05-19 10X Genomics, Inc. Methods, compositions, and kits for determining the location of an analyte in a biological sample
EP4305195A2 (en) 2021-12-01 2024-01-17 10X Genomics, Inc. Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis
WO2023122033A1 (en) 2021-12-20 2023-06-29 10X Genomics, Inc. Self-test for pathology/histology slide imaging device

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4851331A (en) * 1986-05-16 1989-07-25 Allied Corporation Method and kit for polynucleotide assay including primer-dependant DNA polymerase
US4942124A (en) * 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US5002867A (en) 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
AU5358990A (en) * 1989-03-21 1990-10-22 Collaborative Research Inc. Multiplex dna diagnostic test
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
EP0675966B1 (en) 1992-02-19 2004-10-06 The Public Health Research Institute Of The City Of New York, Inc. Novel oligonucleotide arrays and their use for sorting, isolating, sequencing, and manipulating nucleic acids
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
US5789165A (en) 1993-05-10 1998-08-04 Nissui Pharmaceutical Co., Ltd. Method and reagent for simultaneously assaying one or more ligands in a group of preselected ligands
US5604097A (en) * 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5695934A (en) * 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
GB9507238D0 (en) 1995-04-07 1995-05-31 Isis Innovation Detecting dna sequence variations
CN1146668C (en) * 1995-06-07 2004-04-21 林克斯治疗公司 Oligonucleotide tags for sorting and identification
US5830539A (en) * 1995-11-17 1998-11-03 The State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of The University Of Oregon Methods for functionalizing and coating substrates and devices made according to the methods
EP2573101B1 (en) * 1996-02-09 2016-04-20 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
US6458530B1 (en) * 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
GB9609441D0 (en) * 1996-05-04 1996-07-10 Zeneca Ltd Process
TW349909B (en) * 1997-01-22 1999-01-11 Alps Electric Co Ltd Hot transfer printer
US6205444B1 (en) 1997-10-17 2001-03-20 International Business Machines Corporation Multiple sequence alignment system and method
US6238869B1 (en) * 1997-12-19 2001-05-29 High Throughput Genomics, Inc. High throughput assay system
US6395481B1 (en) * 1999-02-16 2002-05-28 Arch Development Corp. Methods for detection of promoter polymorphism in a UGT gene promoter
WO2000058516A2 (en) * 1999-03-26 2000-10-05 Whitehead Institute For Biomedical Research Universal arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6287778B1 (en) * 1999-10-19 2001-09-11 Affymetrix, Inc. Allele detection using primer extension with sequence-coded identity tags
AU2001233521A1 (en) 2000-02-10 2001-08-20 Tm Bioscience Corporation Method of designing and selecting polynucleotide sequences
US7157564B1 (en) 2000-04-06 2007-01-02 Affymetrix, Inc. Tag nucleic acids and probe arrays
ES2302733T3 (en) * 2000-06-22 2008-08-01 Theravance, Inc. CARBOXI-SACARIDS DERIVATIVES OF GLUCOPEPTIDE.
US20030180953A1 (en) * 2000-12-29 2003-09-25 Elitra Pharmaceuticals, Inc. Gene disruption methodologies for drug target discovery
US7226737B2 (en) * 2001-01-25 2007-06-05 Luminex Molecular Diagnostics, Inc. Polynucleotides for use as tags and tag complements, manufacture and use thereof
JP4422963B2 (en) * 2001-01-25 2010-03-03 ルミネックス モレキュラー ダイアグノスティックス, インク. Non-cross-hybridized polynucleotide families, products for use as labels and labeled complements, and methods of use thereof

Also Published As

Publication number Publication date
EP1364065A3 (en) 2003-10-02
EP2327794A3 (en) 2011-09-14
CA2435551A1 (en) 2002-08-01
WO2002059354A2 (en) 2002-08-01
AU2002229435C1 (en) 2002-08-06
BR0206747A (en) 2004-11-30
CA2435551C (en) 2011-10-25
CA2435612A1 (en) 2002-08-01
DK1364065T3 (en) 2012-05-14
WO2002059354A3 (en) 2003-06-26
JP2004526433A (en) 2004-09-02
AU2002229435B2 (en) 2007-06-07
US7645868B2 (en) 2010-01-12
BRPI0206746B8 (en) 2021-07-27
AU2008201349A1 (en) 2008-04-17
JP4588976B2 (en) 2010-12-01
EP2327794A2 (en) 2011-06-01
US20100311957A1 (en) 2010-12-09
EP1356117A2 (en) 2003-10-29
BRPI0206747B1 (en) 2017-03-21
WO2002059355A2 (en) 2002-08-01
JP4422963B2 (en) 2010-03-03
BR0206746A (en) 2004-11-16
EP2325336A1 (en) 2011-05-25
JP2010000086A (en) 2010-01-07
JP5189569B2 (en) 2013-04-24
US8624014B2 (en) 2014-01-07
BRPI0206746B1 (en) 2017-05-02
EP2325336B1 (en) 2014-06-11
EP1364065A2 (en) 2003-11-26
ATE546545T1 (en) 2012-03-15
EP1364065B1 (en) 2012-02-22
CA2435612C (en) 2014-12-23
AU2002227829B2 (en) 2007-12-20
AU2008201349B2 (en) 2010-05-27
US20050191625A1 (en) 2005-09-01
WO2002059355A3 (en) 2003-10-02
JP2004522440A (en) 2004-07-29
AU2002227829C1 (en) 2009-03-05

Similar Documents

Publication Publication Date Title
ES2382542T3 (en) Polynucleotides for use as labels and tag complements, manufacture and use thereof
US7943322B2 (en) Polynucleotides for use as tags and tag complements, manufacture and use thereof
AU2002227829A1 (en) Families of non-cross-hybridizing polynucleotides for use as tags and tag complements, manufacture and use thereof
JP2004522440A5 (en)
US20050186573A1 (en) Polynucleotides for use as tags and tag complements in the detection of nucleic acid sequences
OSZAR »