Scraper tabla de tamaño variable
Publicado por Sergio (21 intervenciones) el 30/01/2018 11:25:55
Buenos días,
Estoy sacando información de una web para alimentar una bbdd de productos, y me he topado con el siguiente problemilla que no logro solventar. Los datos que necesito están dentro de un tbody, y en los tr puedo tener estos casos como ejemplo
o bien
es decir, el número de columnas no es fijo. Y tampoco controlo cuando hace el cambio de columna, ya que todas se llaman tiran de la misma clase. ¿Alguien tiene alguna idea de como paliarlo? Hacerlo a mano puede ser mas infierno ya que los productos son mas de 60.000
Un Coridal Saludo.
Estoy sacando información de una web para alimentar una bbdd de productos, y me he topado con el siguiente problemilla que no logro solventar. Los datos que necesito están dentro de un tbody, y en los tr puedo tener estos casos como ejemplo
1
2
3
4
5
6
7
8
9
10
11
12
13
<tr id="2">
<td class="tlin" valign="top" align="left"><nobr>1</nobr></td>
<td class="tlin" valign="top" align="right">2</td>
<td class="tlin" valign="top" align="center"><nobr>3</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>4</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>5</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>6</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>7</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>8</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>9</nobr></td>
<td class="tlin" valign="top" align="right">11</td>
<td class="tlin" valign="top" align="right">12</td>
</tr>
o bien
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<tr id="x">
<td class="tlin" valign="top" align="left">1<nobr></nobr></td>
<td class="tlin" valign="top" align="right">2</td>
<td class="tlin" valign="top" align="center"><nobr>3</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>4</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>5</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>6</nobr></td>
<td class="tlin" valign="top" align="right">7</td>
<td class="tlin" valign="top" align="right">8</td>
<td class="tlin" valign="top" align="right">9</td>
<td class="tlin" valign="top" align="center"><nobr>10</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>11</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>12</nobr></td>
<td class="tlin" valign="top" align="right">13</td>
<td class="tlin" valign="top" align="right">14</td>
</tr>
es decir, el número de columnas no es fijo. Y tampoco controlo cuando hace el cambio de columna, ya que todas se llaman tiran de la misma clase. ¿Alguien tiene alguna idea de como paliarlo? Hacerlo a mano puede ser mas infierno ya que los productos son mas de 60.000
Un Coridal Saludo.
Valora esta pregunta
0