PHP - Web scraping PHP

 
Vista:
Imágen de perfil de mauro
Val: 50
Ha aumentado su posición en 2 puestos en PHP (en relación al último mes)
Gráfica de PHP

Web scraping PHP

Publicado por mauro (17 intervenciones) el 30/08/2020 20:49:28
como hago para mostrar el codigo fuente "web scraping" a una web que tiene proteccion cloud flare esto que lo que me arroja:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
<!DOCTYPE html>
<html dir="ltr" lang="es">
<head>
<meta charset="utf-8" />
<meta name="generator" content="AntiBot.Cloud v. 7.010" />
<meta name="referrer" content="unsafe-url" />
<meta name="robots" content="noarchive" />
<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no" />
<link rel="icon" href="/favicon.ico">
<link rel="stylesheet" href="https://stackpath.bootstrapcdn.com/bootstrap/4.4.1/css/bootstrap.min.css" integrity="sha384-Vkoo8x4CGsO3+Hhxv8T/Q5PaXtkKtu6ug5TOeNV6gBiFeWPGFN9MuhOf23Q9Ifjh" crossorigin="anonymous">
<title>Espere.</title>
<style>
html, body {text-align:center; margin: 10px;}
body {margin-top: 10%;}
</style>
</head>
<body>
<noscript><h1 style="color:#bd2426;">Active JavaScript y vuelva a cargar la página.</h1></noscript>
<div class="text-center">
<div class="spinner-border" role="status">
<span class="sr-only">Loading...</span>
</div>
</div>
<br />
<h2>Verificando su navegador antes de acceder al sitio.</h2>
<p>Este proceso es automático. Su navegador redirigirá a su contenido solicitado en breve.</p>
<p id="btn">Por favor espere unos segundos.</p>
<p id="error" style="color:red;"></p>
<div class="footer">
<p><small><a href="https://antibot.cloud/#digitask.ru" title="Detect & Block Bad Bot Traffic" target="_blank">Protected by AntiBot.Cloud</a></small></p>
</div>
<script>userip = "201.2xxxxx.xxx.";</script>
 
<script src="https://www.google.com/recaptcha/api.js?render=6LdOLMAUAAAAADWpsyq-fXIrXnG8eTU0judcHJiF"></script> <script>
if (window.location.hostname !== window.atob("ZGlnaXRhc2sucnU=")) {
window.location = window.atob("aHR0cDovL2RpZ2l0YXNrLnJ1L25vdGltZXJfZnAvZmF1Y2V0LnBocD9hZGRyZXNzPURHajJGaktuY2VYVzY5Q3dTQllHcnZyM05Ra2dmamlWNDMmY2FwY29kZT01ZWFhOGY0NDU1YzViNDQ3YjljZjZlNmMxMGZjODZiMiU3Qzc5YjRkMzc4NTFiYzkwY2VkNmYyN2M0YzI4ZTMwYzhlJTdDaHR0cCUzQSUyRiUyRmJhY2sxMC5rZXljYXB0Y2hhLmNvbSUyRnN3ZnMlMkZja2MlMkYzNTZmMzQxYmE5MjZhZDE1ZTMyODMxYmNlYTExM2ZmMi0lN0M1ZjRhYWFkY2I5NGI2LTQuMC4wLjAwMSU3QzEmd2FsbGV0PSZjdXJyZW5jeT1ET0dFJmtleT01N2ZlMTJkYjY1MjljZTQ1M2I3YmU1YjNmMTQ4YTc5Mw==");
throw "stop";
}
</script>
<script>
setTimeout(Button, 5000);
//var action = 'PE';
var action = 'digitaskru';
var h1 = 'd7caec816ae72aec0a29ee14a052e891';
var h2 = '8d94fc0f1235f460baf3c220edc9405b';
var ip = '201xxxxxxx.xx';
var via = '';
var v = '7.010';
var re = '1';
var ho = '0';
var cid = '1598813074.5001';
var ptr = 'client-201.240.xxx.xx'.speedy.net.pe';
var width = screen.width;
var height = screen.height;
var cwidth = document.documentElement.clientWidth;
var cheight = document.documentElement.clientHeight;
var colordepth = screen.colorDepth;
var pixeldepth = screen.pixelDepth;
var phpreferrer = '';
var referrer = document.referrer;
if (referrer != '') {var referrer = document.referrer.split('/')[2].split(':')[0];}

ESTE ES MI CODIGO :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
<?php
 
 
function url($url){
        //$headers = array();
 
                                                                                                             $agent = "user-agent: Mozilla/5.0 (Linux; Android 8.0.0; SAMSUNG SM-G935F) AppleWebKit/537.36 (KHTML, like Gecko) SamsungBrowser/11.1 Chrome/75.0.3770.143 Mobile Safari/537.36";                         $ch = curl_init();                                                                                   curl_setopt($ch, CURLOPT_URL, $url);                                                                 curl_setopt($ch, CURLOPT_REFERER, 'https://digitask.ru/notimer_fp/faucet.php?address=DGj2FjKnceXW69CwSBYGrvr3NQkgfjiV43&capcode=5eaa8f4455c5b447b9cf6e6c10fc86b2%7C79b4d37851bc90ced6f27c4c28e30c8e%7Chttp%3A%2F%2Fback10.keycaptcha.com%2Fswfs%2Fckc%2F356f341ba926ad15e32831bcea113ff2-%7C5f4aaadcb94b6-4.0.0.001%7C1&wallet=&currency=DOGE&key=57fe12db6529ce453b7be5b3f148a793');
        curl_setopt($ch, CURLOPT_AUTOREFERER, true);
        curl_setopt($ch, CURLOPT_POST, true);
 
        curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);                                                                                                                                                          curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);                                                         curl_setopt ($ch, CURLOPT_COOKIEJAR, $cookie);
        curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true);
        curl_setopt ($ch, CURLOPT_USERAGENT, 'Mozilla/5.0');
      //curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
      curl_setopt($ch, CURLOPT_HTTPHEADER, array('HeaderName: HeaderValue', $agent, 'accept-language:
es-PE,es-419;q=0.9,es;q=0.8,en;q=0.7'));                                                                   $result = curl_exec($ch);                                                                      return $result;
}
$result = url("https://digitask.ru/notimer_fp/faucet.php?address=DGj2FjKnceXW69CwSBYGrvr3NQkgfjiV43&c
apcode=5eaa8f4455c5b447b9cf6e6c10fc86b2%7C79b4d37851bc90ced6f27c4c28e30c8e%7Chttp%3A%2F%2Fback10.keycaptcha.com%2Fswfs%2Fckc%2F356f341ba926ad15e32831bcea113ff2-%7C5f4aaadcb94b6-4.0.0.001%7C1&wallet=&currency=DOGE&key=57fe12db6529ce453b7be5b3f148a793");
    echo "$result\n";


YA ALGUIEN LE ISO WEB SCRAPING NO SE POR QUE ME ESTA FALTANDO
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder
Imágen de perfil de joel
Val: 3.828
Oro
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

Web scraping PHP

Publicado por joel (1269 intervenciones) el 31/08/2020 08:08:50
Hola Mauro, tu código PHP tiene varias instrucciones en una linea... es imposible de seguir... ha sido un problema en el momento de copiarlo?

Puedes copiarlo con una instrucción por linea?
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de mauro
Val: 50
Ha aumentado su posición en 2 puestos en PHP (en relación al último mes)
Gráfica de PHP

Web scraping PHP

Publicado por mauro (17 intervenciones) el 31/08/2020 16:36:18
claro que si bro espero me puedas ayudar este es mi codigo :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
<?php 
 function url($url){
$headers = array();
$headers[] = "Host:digitask.ru";
$headers[] = "accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9";
$headers[] = "accept-language:es-PE,es-419;q=0.9,es;q=0.8,en;q=0.7";
$headers[] = "Cookie: ft=61598728958;_ym_uid=1595969556539684976;_ym_d=1595969556;_ga=GA1.2.2036567320.1595969557;antibot_uid=d4a206609f0bf5e8b9c8a50e126b91ef;antibot_referer=https%3A%2F%2Fdigitask.ru%2F%3Fr%3DDRebQo5uPfy6Vyhew17sf3X72uMxZgtUAo;address_DOGE=DGj2FjKnceXW69CwSBYGrvr3NQkgfjiV43;__cfduid=d3f8d491180bffaef2557c5651507a0161598728295;antibot_662345948f14628699de5b3c5809a560=fc3197fc58192c4e0d3c14e14e092001;__atuvc=21%7C31%2C0%7C32%2C0%7C33%2C0%7C34%2C5%7C35;bidswitch_last_time=1598823949299;_gid=GA1.2.1545024461.1598823950;_ym_isad=2;rekmob_last_seen_c7384edf01d64edd88a1443cf301fefd=1598824090752;rekmob_last_seen_df7c16a7098a4b5881b72703eef7cd0c=1598824090827;rekmob_last_seen_dd0f6bb180c64d898171986d1aea58e2=1598824090892;rekmob_last_seen_09010173e50d4a559c86fadfbafa3797=1598824091007;rekmob_last_seen_1f2b0bf06f9e40baa5ad6fac7f27c007=1598824091128;cto_bundle=TSNaCV9EMld4YXJsZ1RjVm9aOHMlMkZ5YjRSNFVQJTJCSFhZcEY2S2Rua3lJQkU5dlZ3cmRFckFhcmw5dmdTV2dJUVMwUHFTSzhoVVFRUlNsQURKd0tHNTEzbHZQQzVUcTFVdWp2UUJWcnNXTnZiVGhocXE2NmR0YVkyM2V3R2N6OSUyRlVreWtUR3k1SW1kam8lMkZBMldZTCUyQjBxMjBiV0pBJTNEJTNE;rekmob_props_591630=%7B%22date%22%3A1598823624761%2C%22rekJs%22%3A%7B%22rekmob_ad_unit_type%22%3A1%2C%22rekmob_native_type%22%3Anull%2C%22rekmob_ad_width%22%3A300%2C%22rekmob_fixed_cpm%22%3A0%2C%22rekmob_network_ids%22%3A%22crt_id%3D0%22%2C%22rekmob_ad_unit%22%3A%22c7384edf01d64edd88a1443cf301fefd%22%2C%22rekmob_app_type%22%3A1%2C%22rekmob_ad_height%22%3A250%2C%22region_id%22%3A591630%7D%2C%22countryCode%22%3A%22PE%22%2C%22cookieTime%22%3A1598883355741%7D;rekmob_props_547047=%7B%22date%22%3A1598823420656%2C%22rekJs%22%3A%7B%22rekmob_ad_unit_type%22%3A3%2C%22rekmob_native_type%22%3Anull%2C%22rekmob_ad_width%22%3A728%2C%22rekmob_fixed_cpm%22%3A0%2C%22rekmob_network_ids%22%3A%22imdi_placement_id%3D22042045%3Bcrt_id%3D0%22%2C%22rekmob_ad_unit%22%3A%22dd0f6bb180c64d898171986d1aea58e2%22%2C%22rekmob_app_type%22%3A1%2C%22rekmob_ad_height%22%3A90%2C%22region_id%22%3A547047%7D%2C%22countryCode%22%3A%22PE%22%2C%22cookieTime%22%3A1598883355746%7D;rekmob_props_607003=%7B%22date%22%3A1598823899230%2C%22rekJs%22%3A%7B%22rekmob_ad_unit_type%22%3A23%2C%22rekmob_native_type%22%3Anull%2C%22rekmob_ad_width%22%3A160%2C%22rekmob_fixed_cpm%22%3A0%2C%22rekmob_network_ids%22%3A%22crt_id%3D0%22%2C%22rekmob_ad_unit%22%3A%221f2b0bf06f9e40baa5ad6fac7f27c007%22%2C%22rekmob_app_type%22%3A1%2C%22rekmob_ad_height%22%3A600%2C%22region_id%22%3A607003%7D%2C%22countryCode%22%3A%22PE%22%2C%22cookieTime%22%3A1598883355749%7D;rekmob_props_547149=%7B%22date%22%3A1598823597502%2C%22rekJs%22%3A%7B%22rekmob_ad_unit_type%22%3A1%2C%22rekmob_native_type%22%3Anull%2C%22rekmob_ad_width%22%3A300%2C%22rekmob_fixed_cpm%22%3A0%2C%22rekmob_network_ids%22%3A%22imdi_placement_id%3D22042046%3Bcrt_id%3D0%22%2C%22rekmob_ad_unit%22%3A%22df7c16a7098a4b5881b72703eef7cd0c%22%2C%22rekmob_app_type%22%3A1%2C%22rekmob_ad_height%22%3A250%2C%22region_id%22%3A547149%7D%2C%22countryCode%22%3A%22PE%22%2C%22cookieTime%22%3A1598883355781%7D;rekmob_props_551290=%7B%22date%22%3A1598823657517%2C%22rekJs%22%3A%7B%22rekmob_ad_unit_type%22%3A1%2C%22rekmob_native_type%22%3Anull%2C%22rekmob_ad_width%22%3A300%2C%22rekmob_fixed_cpm%22%3A0%2C%22rekmob_network_ids%22%3A%22imdi_placement_id%3D22064433%3Bcrt_id%3D0%22%2C%22rekmob_ad_unit%22%3A%2209010173e50d4a559c86fadfbafa3797%22%2C%22rekmob_app_type%22%3A1%2C%22rekmob_ad_height%22%3A250%2C%22region_id%22%3A551290%7D%2C%22countryCode%22%3A%22PE%22%2C%22cookieTime%22%3A1598883355784%7D;_gat_gtag_UA_88036955_1=1"
 $agent = "user-agent: Mozilla/5.0 (Linux; Android 8.0.0; SAMSUNG SM-G935F) AppleWebKit/537.36 (KHTML, like Gecko) SamsungBrowser/11.1 Chrome/75.0.3770.143 Mobile Safari/537.36";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
 curl_setopt($ch, CURLOPT_REFERER, 'https://digitask.ru/notimer_fp/faucet.php?address=DGj2FjKnceXW69CwSBYGrvr3NQkgfjiV43&capcode=5eaa8f4455c5b447b9cf6e6c10fc86b2%7C79b4d37851bc90ced6f27c4c28e30c8e%7Chttp%3A%2F%2Fback10.keycaptcha.com%2Fswfs%2Fckc%2F356f341ba926ad15e32831bcea113ff2-%7C5f4aaadcb94b6-4.0.0.001%7C1&wallet=&currency=DOGE&key=57fe12db6529ce453b7be5b3f148a793');
 curl_setopt($ch, CURLOPT_AUTOREFERER, true);
curl_setopt($ch, CURLOPT_POST, true)
 curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_COOKIEJAR, $cookie);
 curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true);
 curl_setopt ($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
 
 $result = curl_exec($ch);
 return $result;
}
$result = url("https://digitask.ru/notimer_fp/faucet.php?address=DGj2FjKnceXW69CwSBYGrvr3NQkgfjiV43&capcode=5eaa8f4455c5b447b9cf6e6c10fc86b2%7C79b4d37851bc90ced6f27c4c28e30c8e%7Chttp%3A%2F%2Fback10.keycaptcha.com%2Fswfs%2Fckc%2F356f341ba926ad15e32831bcea113ff2-%7C5f4aaadcb94b6-4.0.0.001%7C1&wallet=&currency=DOGE&key=57fe12db6529ce453b7be5b3f148a793");
 
 echo "$result\n";
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de joel
Val: 3.828
Oro
Ha mantenido su posición en PHP (en relación al último mes)
Gráfica de PHP

Web scraping PHP

Publicado por joel (1269 intervenciones) el 31/08/2020 19:28:08
Hola Mauro, he conseguido revisar el código y me muestra el error "1010"
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar
Imágen de perfil de mauro
Val: 50
Ha aumentado su posición en 2 puestos en PHP (en relación al último mes)
Gráfica de PHP

Web scraping PHP

Publicado por mauro (17 intervenciones) el 31/08/2020 22:22:09
correji el codigo y me sale esto hermano la proteccion de anti.bot:


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
olordepth = screen.colorDepth;
var pixeldepth = screen.pixelDepth;
var phpreferrer = '';
var referrer = document.referrer;
if (referrer != '') {var referrer = document.referrer.split('/')[2].split(':')[0];}
 
grecaptcha.ready(function() {
document.getElementById("btn").innerHTML = '☑☐☐'; // receiving token
grecaptcha.execute('6LdOLMAUAAAAADWpsyq-fXIrXnG8eTU0judcHJiF', {action: action}).then(function(token) {
document.getElementById("btn").innerHTML = '☑☑☐'; // token received
var data = 'action='+action+'&token='+token+'&h1='+h1+'&h2='+h2+'&ip='+ip+'&via='+via+'&v='+v+'&re='+re+'&ho='+ho+'&cid='+cid+'&ptr='+ptr+'&w='+width+'&h='+height+'&cw='+cwidth+'&ch='+cheight+'&co='+colordepth+'&pi='+pixeldepth+'&ref='+referrer;
CloudTest(window.atob('aHR0cHM6Ly9jbG91ZC5hbnRpYm90LmNsb3VkL2FudGlib3Q3LnBocA=='), 4000, data, 0);
});
});
 
function Button() {
document.getElementById("btn").innerHTML = window.atob("PGZvcm0gYWN0aW9uPSIiIG1ldGhvZD0icG9zdCI+PGlucHV0IG5hbWU9InRpbWUiIHR5cGU9ImhpZGRlbiIgdmFsdWU9IjE1OTg5MDUxNjYiPjxpbnB1dCBuYW1lPSJhbnRpYm90IiB0eXBlPSJoaWRkZW4iIHZhbHVlPSI0YjFmMWRmODY3NmZmOWZiMzkzODVhMGJkODA2OGYxYSI+PGlucHV0IG5hbWU9ImNpZCIgdHlwZT0iaGlkZGVuIiB2YWx1ZT0iMTU5ODkwNTE2Ni44OTcxIj48aW5wdXQgc3R5bGU9ImN1cnNvcjogcG9pbnRlcjsiIGNsYXNzPSJidG4gYnRuLXN1Y2Nlc3MiIHR5cGU9InN1Ym1pdCIgbmFtZT0ic3VibWl0IiB2YWx1ZT0iQ2xpY2sgdG8gY29udGludWUiPjwvZm9ybT4=");
document.getElementsByName('submit')[0].value = "Haz click para continuar";
}
 
function CloudTest(s, t, d, b){
var cloud = new XMLHttpRequest();
cloud.open("POST", s, true)
cloud.setRequestHeader('Content-type', 'application/x-www-form-urlencoded;');
cloud.timeout = t; // time in milliseconds
 
cloud.onload = function () {
if(cloud.status == 200) {
  document.getElementById("btn").innerHTML = '☑☑☑';
  console.log('good: '+cloud.status);
var obj = JSON.parse(this.responseText);
if (typeof(obj.error) == "string") {
document.getElementById("error").innerHTML = obj.error;
}
if (typeof(obj.cookie) == "string") {
document.getElementById("btn").innerHTML = "Cargando página, por favor espere...";
var d = new Date();
d.setTime(d.getTime() + (7*24*60*60*1000));
var expires = "expires="+ d.toUTCString();
document.cookie = "antibot_662345948f14628699de5b3c5809a560="+obj.cookie+"; " + expires + "; path=/;";
document.cookie = "lastcid="+obj.cid+"; " + expires + "; path=/;";
location.reload(true);
} else {
Button();
console.log('bad bot');
}
} else {
document.getElementById("btn").innerHTML = '☑☑☒';
  console.log('other error');
  if (b == 1) {Button();} else {CloudTest(window.atob('aHR0cHM6Ly9hbHQuYW50aWJvdC5jbG91ZC9hbnRpYm90Ny5waHA='), 4000, d, 1);}
}
};
cloud.onerror = function(){
        document.getElementById("btn").innerHTML = '☑☑☒';
        console.log("error: "+cloud.status);
        if (b == 1) {Button();} else {CloudTest(window.atob('aHR0cHM6Ly9hbHQuYW50aWJvdC5jbG91ZC9hbnRpYm90Ny5waHA='), 4000, d, 1);}
}
cloud.ontimeout = function () {
  // timeout
document.getElementById("btn").innerHTML = '☑☑☒';
  console.log('timeout');
  if (b == 1) {Button();} else {CloudTest(window.atob('aHR0cHM6Ly9hbHQuYW50aWJvdC5jbG91ZC9hbnRpYm90Ny5waHA='), 4000, d, 1);}
};
cloud.send(d);
}
</script>
</body>
</html>
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar