Xenu s link sleuth: Xenu’s Link Sleuth — Скачать

Содержание

Find broken links on your site with Xenu’s Link Sleuth (TM)



Find broken links on your site with Xenu’s Link Sleuth (TM)  

Find broken links on web sites


Wikipedia article about Xenu’s Link Sleuth

Description

Xenu’s Link Sleuth (TM) checks Web sites for broken links. Link verification is done on «normal» links, images, frames, plug-ins, backgrounds, local image maps, style sheets, scripts and java applets. It displays a continously updated list of URLs which you can sort by different criteria. A report can be produced at any time.

Additional features:

  • Simple, no-frills user-interface
  • Can re-check broken links (useful for temporary network errors)
  • Simple report format, can also be e-mailed
  • Executable file smaller than 1MB
  • Supports SSL websites («https:// «)
  • Partial testing of ftp, gopher and mail URLs
  • Detects and reports redirected URLs
  • Site Map

Download

System requirements: Microsoft Windows 95/98/ME/NT/2000/XP/Vista/7/8/10, WININET.DLL required (included with Internet Explorer). No, it won’t work on Windows 3.11, not even with Win32s. No, I won’t make a Java, MacOS, Linux, Knoppix, Ubuntu, Beos, Palm, C64, SAP, AmigaOS, Blackberry, Symbian, iPhone or Android version. Don’t even ask! (However I have been told that it runs faultlessly under Fedora 13, Red Hat 8, Ubuntu, Kubuntu 14.04 and OS X via wine or WineBottler, and under Crossover on a Mac :-))

To have peace of mind, I recommend that you are using an up-to-date anti-virus software on your computer (so do I!).

Ok, I have read all that, I want to download! (current version: 1.3.8 from September 4th, 2010) or try a beta version

 
Getting started:
Unzip it and install it wherever you want. To check a site, click the toolbar icon on the left and enter a WWW address. If the address finishes with a directory name, don’t forget to put a
/
at the end or you will possibly get the whole parent directory spidered.

Incorrect:
http://www.host.com/user

Correct:
http://www.host.com/user/

You can also click the «browse» button to check a local HTML file. If you do not already use IE for browsing and are sitting behind a company firewall, don’t forget to configure your proxy before you start. If you are using a personal firewall (like ZoneAlarm or Outpost) you must enable Microsoft Internet Explorer by starting it, entering a URL and then «allowing» the application (you may also have to enable Xenu — see example for Norton Intenet Security). To find out what the software can do, simply try out the menu choices, the toolbar and the right mouse key. Or read this third-party manual, a bigger third-party manual with many pictures, a third-party report (How I check over 6,000 links every seven to ten days), a blog post by a SEO guy, or deutsche Beschreibung und noch eine, guide en français, nederlandse beschrijving, descripción en español, русское описание, Український опис, Beskrivelse på dansk, opis w języku polskim, opis na Srpsko-Hrvatskom jeziku.

Good luck! If you find the software useful, please click here.
 

Test everything. Hold on to the good.
(1 Thessalonians 5:21)

Join the Update Announcements mailing list at Yahoo Groups! To subscribe, send an empty e-mail to [email protected]

You can also join the user group by sending an e-mail to [email protected]
If you like to use a button for Xenu’s Link Sleuth on your web page, link to this page with these buttons: 
If you like to use a banner for Xenu’s Link Sleuth on your web page, link to this page with this banner:
 
 

The address of this web page is http://home.snafu.de/tilman/xenulink.html


Frequently Asked Questions (FAQ)

1. Who is Xenu?

See here.

2. Is Xenu’s Link Sleuth (TM) better than Incontext WebAnalyzer?

Incontext WebAnalyzer is no longer available since February 2002 and hadn’t been updated for years, so this is more a historical note.

The answer to the question: Yes and No. Xenu’s Link Sleuth (TM) does not have the graphic capabilities of Incontext WebAnalyzer 2.0 («Wavefront view»). But here are some of the advantages of Xenu’s Link Sleuth (TM):

  • It is free
  • Simple user-interface
  • Better error reports (not just «network error»)
  • «Save» works also while the software is busy
  • The «broken links view» shows only broken links; In WebAnalyzer you’d have to press the button again and again as the window fills with crap.
  • While Xenu does not offer an «update» facility (which doesn’t work anyway), it has a «recheck broken links» function that works fine.
  • It is small, written by one person experienced in Windows software development since 1993 and who works as a professional software developer since 1983. This means that bugs will be corrected quickly. This is a matter of honour.
  • The report can be viewed easily, even when you have long URLs.
  • Uses much less disk space for intermediate files, executable file much smaller
  • Loading of saved files much faster (WebAnalyzer loses time by displaying the extra graphics)
  • Supports SSL websites («https:// «)
  • Partial testing of ftp and gopher sites
  • Search for local orphan files
  • Special handling of redirected URLs
  • Site Map
  • Partial randomization of checking order, means less concurrent requests on a single server
Check your website both with this product and with another product (Linkbot, LinkScan, LinkAlarm, Web Link Validator, Screaming Frog and InSpyder offer trial versions, LinkExaminer is free and seems to be pretty good for SEO oriented tasks), and decide what you need and what you are willing to pay. If you do find something better in a different tool, tell me, even if it hurts 🙂

3. Is Xenu better than a web-based service?

There’s a free WWW based service called «LinkTiger» which looks pretty nice, although it isn’t free, except for a 100 links (As of October 2010). Their web page is very nicely designed and made me think about whether (in general, not related to LinkTiger or Xenu) such a solution is better or not.

Audisto.com (as of June 2013 it was known as strucr.com) is also interesting (One of the founders invited me into a restaurant and we had a very nice talk). Audisto.com focuses on «the big picture» with websites. Not so much just finding broken links (it does not check external links), but find URLs that could be a problem for SEO, or find certain common HTML problems. Their target are big, really big websites (several millions of urls), where the web team has lost the understanding about what is going on. Sadly they no longer have free subscriptions (see pricing).

Server solution advantages:

  • No need to install anything
  • Independent of user OS
  • No use of client bandwith
  • Might be able to do more URLs, because servers will usually not keep all URLs in memory
  • Features can be updated without the user having to update his own system
Server solution disadvantages:
  • Dependent of server bandwidth
  • Cannot always be free, due to costs for hosting
  • Passwords must be uploaded to server
  • Cannot check intranets or local sites on HDD
  • Security risk if server gets hacked
  • Some server solutions insist on uploading an authorization file; might be difficult for companies with long decision delays
  • Legal risk if service is used to analyse competition
Client solution advantages:
  • Can run a check at any time
  • Passwords can be kept locally
  • Can check intranets or local sites on http://localhost or HDD (before they get uploaded!)
  • Tailored versions can be made
  • Would still be usable if I suddenly get hit by a safe
  • Check can be done without asking
Client solution disadvantages:
  • Security risk if software developer moves over to the dark side
  • Client bandwith is used
  • Dependent of having a computer that can run downloaded software
  • Dependent of having the correct OS (unless the client is written in Java)
  • Dependent of the RAM amount
Any more ideas pro or contra one of the two solutions? Contact me. (If you want to report a bug, click here).

4. Can I support the author?

Don’t send me your money — I still have my day job and survived the 2008 financial crisis 🙂 If you feel that my work is useful to you (maybe it helped with your job, maybe you were able to impress your boss?), please donate money to causes I support, or send me gifts.
  • In Germany: please support Netzpolitik.org.
  • in the UK: make a donation or subscribe to the Guardian.
  • in France: please support La Quadrature du Net.
  • elsewhere: please support wikileaks, independent press (good journalism is not free) or civil rights NGOs.
  • or send me a T-Shirt of your city, university, employer in XL size. Take into consideration that I’ll be wearing your T-Shirt at work. USPS «airmail letter post» is fast, reliable and unexpensive.
  • You can also send me objects that are cultural icons, i.e. a product that your country is famous for.
  • You can also send me packaged food (no meat or fish, this is likely forbidden by customs). If you are in Belgium, send beer. If you’re not sure, ask.
  • Mention the product and my name in your blog.
  • Send me a «thank you» letter on company paper, if you work for a well-known company. Make sure that you are authorized to send such a letter. This is my street address:
    Tilman Hausherr
    Poschingerstrasse 14
    12157 Berlin
    Germany

If you are on facebook, you can also click «like» here and here to increase the statistic near my name or near the product 🙂

Other things I need help with: if you’re an english native speaking person who understands german and knows the lingo of recipes, please check the third-party translation of this recipe of a Xenu cake by Ilse Hruby (you might try it, too! It tastes great!)

5. Why does Xenu’s Link Sleuth (TM) report http://www.site.com/../page/index.html as broken?

The key is the «../» part. It means you have e.g. a top level page that links to a page in a directory above, which doesn’t exist. It is true that Mozilla will not have any problems with such a page; but I am less tolerant.

6. How can I configure a proxy?

You can configure a proxy in the control application of Windows. Double-Click on the «internet» symbol, then click on the «card» of the dialog box that is named «Connection». You may need a proxy if you are sitting «behind a firewall». This is usually so in big corporate networks.

One user with Windows 2000 always had a timeout, he solved it by checking «Use HTTP 1.1» and also «Use HTTP 1.1 through proxy connections» in the «Advanced» tab of the Internet Options in the control panel. However, this may not work for everyone, because some web servers do not support HTTP 1.1.

7. Why does Xenu’s Link Sleuth(TM) report a URL with a space in it?

Either because you do have a space in the URL, or because you have a carriage return / newline in it. Although Mozilla tolerates this, I do not.

8. I use Mozilla 3.0 Gold and can’t get rid of file: URLs for images. What can I do?

Re-edit the page, double-click on the picture, remove file: from the picture location and take care to uncheck «copy image to document’s location» in the «properties» dialog box (at the bottom left) before you save and exit the dialog box.

9. What is the maximum number of URLs that can be checked?

There is no fixed number, but it seems to be above one million. The problem is that Windows XP applications have a size of 2GB max.

A 64 bit beta version is available which may or may not allow more URLs. Just unpack the ZIP file and move the XENU.EXE and ZLIBWAPI.DLL files at the place where you have the XENU.EXE file currently (rename the old XENU.EXE file first to save it). The new one is based on Microsoft Visual Studio 2010. The 64 bit EXE file is about 10 times as big as the 32 bit version that is based on the good old Visual Studio 1998. Microsoft has confirmed the problem.

10. Can the software check my site locally?

Since september 1998 (1.0n), you can do so without a local web server (your address would then be http://127.0.0.1). Use the «Browse» button in the «New» dialog box.

The results will not always be the same as a «remote» check:

  • Sometimes you’ll get «error 3». It happens because the WININET.DLL is unable to handle directories, i.e. links that end with «/». You can avoid this by linking to the actual «main file», usually index.html or default.html. That your browser can handle local directories and display them nicely, is because he does additional work, which I do not.
  • Mixups of higher/lower case characters in links won’t be found, since Windows does not make a difference. But UNIX does!
  • The main reason that you still need to make occasional «remote» checks is because you might have forgotten to upload your files to your WWW server.
A user of IE 4.0 reported that when not online, the software checks every «remote» URL like a local file. This is a problem of the newer version of the WININET.DLL; the version with IE 3.0 reports «no connection» or «no such host» instead, which is more logical.

11. Does it work on Windows NT 3.51?

One user said it worked fine after he copied a version of WININET.DLL from a Windows 95 system standing nearby, and put it into the directory where Xenu’s Link Sleuth(TM) was installed.

12. How is it so damn fast?

Because it uses a (possibly patented, see patents here and here) technique known as preemptive multithreading. It means that the link checking software retrieves several web pages at the same time; the competition uses the same technique. The maximum count of threads is initially set to 30, but you can configure it to any number between 1 and 100. A number that is too high might result in failed connections or in timeouts, which means you will have to recheck the broken links. At the time I had a dial-up connection, I got good results with 70. Now I have a DSL connection, and I have to set the number to 1-5. I suspect that my DSL provider has installed a brake somewhere to prevent «commercial» customers from using the unexpensive «private» service.

13. Can I have the source code?

Hahahahahaha!

14. Can I buy the source code?

Sure, make me «an offer I can’t refuse».

15. Just for fun, I checked Tilman’s web site, and found many broken links. Why?

I check my own web site every week on friday. Nevertheless there are always broken links:
  • Links that I know to be broken: I keep them like that to remind me to find these people some day. The web page itself has a notice that the link is broken.
  • Temporary unreachable hosts: these are temporary routing errors.
  • Really broken links: I will usually correct the link or remove it within the next few days.

16. How do I correct broken links?

Repairing broken links (i.e. getting the correct ones) is a difficult task that takes time, but with experience, you’ll get it done faster and faster.
  • if you have the e-mail address of the site owner (because you know him), try an e-mail. Sometimes the address still works, even if the web site is gone.
  • find the home page of the site you link to, to see if the site has a «sorry we moved» message. If you linked to http://www.host.com/user/page888.html and this is broken, look at http://www.host.com/user/ to see if there is a message, or to see if the site has been reorganized. Some sites reorganize their user pages differently, e.g. http://www.host.com/homepages/users/page888.html. Sometimes the web switches changes between the two methods. Other sites are owned by the user himself, e.g. www.user.com, so the home page is the root page. If the site exists but you cannot find your page, send an e-mail to the owner.
  • use search engines to find the site or the name of the site owner (if you know). To find where the site is, use web search engines (like Google or the Internet Archive) and usenet search engines (like Google Groups).
    • You find the site you searched for
    • You find a site that links to the site you searched for
    • You find the site in the Google Cache or the Internet Archive (simply enter the URL in the search box!), and can use the contents to search for the name of the owner
    • You find a site that links to the site you searched for, but is also broken. E-mail the site owner, and tell him that the link is broken. Bookmark the site and revisit it in a week, to see if the other person has found it. If not, you have nevertheless succeeded in making the other person feel as bad as you, which brings some relief 🙂
    • You find the new e-mail address of the user. Either e-mail him, or try to construct the URL yourself ([email protected] leads to http://www.host.com/user/)
  • post a message in a newsgroup that deals with the topic. Hopefully the site owner or one of his friends reads the messages there.
  • if you are still unsuccessful, either delete your link to the site or repeat your attempts after a month (some sites might reappear in a search engine after some time). Sometimes it happens that a host is reorganizing its hard disk, and all user pages get back within a few days.

17. What about ftp and gopher sites?

Starting with version 1.0k I have implemented a new ftp checking method that is 100% reliable. Sadly, this method does not work with proxies. The previous method I used (and still use for gopher) was unreliable, as it did not detect certain errors.

The method for checking gopher sites is still unreliable. When an ftp or gopher site is accessed through a proxy, this proxy builds up a web page. Sadly, it doesn’t always bring up the information whether the URL exists or not. When you access a gopher site without a proxy, it brings an error message, but not an error code. This seems to be a bug of the OpenURL() function of WININET.DLL.

The output lists ftp and gopher sites as links, which allows you to make a manual check of these sites.

18. Why can’t I launch URLs?

Starting with version 1.0g (Christmas 1997), URLs are launched with DDE («dynamic data exchange», a windows method of communication between applications), to open many browser windows but to prevent the opening of several Netscape applications. This is done with the help of the Registry, by searching for HKEY_CLASSES_ROOT\http\shell\open. This has the path for the browser, the DDE application name (e.g. «Netscape», «IExplore»), the DDE topic (usually «WWW_OpenURL»), and a template for the DDE item (usually «%1»). If you cannot launch a URL, do not panic — export and e-mail me the segment of your registry (start REGEDIT.EXE, and search for «http»). Additionally, send me the file XENULOG.TXT which you will find in your %TEMP% directory.

The cause is usually that you have not installed your browser properly (maybe you just transferred the files from another computer). Solution: update or reinstall your browser.

Starting with version 1.1b, I have stopped displaying an error message when the registry is incomplete, because there were too many complaints. Instead, the browser will simply be launched with the page. This has the disadvantage that the page won’t be displayed in an extra window of the current active browser application.

One user with Microsoft Vista 64 (UAC disabled) was unable to launch URLs (message box: «Unable to open browser for ‘URL’: error 5: Access is denied»). The cause was COMODO Firewall Pro 3.0.25.378. Without the firewall, it worked fine. Please remember that «Personal Firewalls» are mostly snake-oil. Set up an external firewall box instead — this is usually included in your router.

18a. Why does the browser not open a new window?

This is a problem with Microsoft Internet Explorer. Open your registry and search for HKEY_CLASSES_ROOT\http\shell\open\ddeexec. If the key value is «%1»,,-1,0,,,, then change it to «%1»,,0,0,,,, (i.e. you change the -1 to 0).

18b. Why does Link Sleuth freeze when launching the report?

If Link Sleuth freezes when launching the report, but not when double-clicking on a URL, the reason might be the site map. A site map can be HUGE if the site goes very «deep» (high level, see the «level» column in the Link Sleuth window). A very «deep» site can happen if you have a forum.

Solution: disable the site map in the options dialog, or exclude the «deep» parts of your website (e.g. a forum) in the initial dialog box.

Version 1.3 has an abort dialog.

18c. Why does Link Sleuth freeze when launching the report or a URL?

I do not know why this happens, but I have experienced this myself with Windows ME (but not with Windows XP), and have received similar reports from users. The problem goes away by rebooting Windows, but comes back later. You can also get rid of the problem by making a change in the XENU.INI file below the line with [Options], enter this:
UseDDE=0
The only disadvantage is that it will not open a new window in the browser.

19. What about cookies?

By default, cookies are disabled, and Xenu rejects all cookies.

If you need cookies because

  • you have used Internet Explorer to authenticate yourself before starting a run
  • to prevent the server from delivering URLs with a session ID
then you can enable the cookies in the advanced options dialog.
(This has been available since Version 1.2g)

Warning:
You should not use this option if you have links that delete data, e.g. a database or a shop — you are risking data loss!!!

20. Why are some links reported as «broken» by Xenu, that can be displayed within my browser?

Some servers read the «User Agent», i.e. the name of the software that tries to access a website. Some websites allow only browsers, some even only Microsoft Internet Explorer, and refuse everything else. Some may even specifically refuse Xenu because of past misuse. Andi has a list of websites that deny access to Xenu. Tom Boutell has an extended explanation of how wikipedia denies access. A user-configurable «User Agent» would be the solution, but this would make abuse possible.

21. Why can’t I connect to «secure» (https) sites ?

If you have set your proxy correctly, try to connect with IE. If this doesn’t work, read this usenet post for help. If this still doesn’t work and you use Windows NT 4.0, install the latest NT service packs (up to SP5).

22. Any known problems with Windows 95?

Some people have reported crashes. These problems were usually solved by installing IE 3.0 (or higher) or the following service packs: One guy had problems with the WININET.DLL (v. 4.70.1300) installed with OEM Windows 95 (v. 95 4.00.950 C). Changing to version 4.70.1335 solved the problem.

A simpler solution is to go to http://windowsupdate.microsoft.com and install whatever they tell you (you need to have IE 4.0 or higher on your system)

23. Any known problems with Windows 2000?

Although I received many reports that it runs fine, one user reported a problem and a solution:

Windows 2000 automatically sets a configuration option to use HTTP 1.1 for connecting to web sites. Many, many web sites do not use that version but continue to use HTTP 1.0, so the automatic setting may prevent connections. This is the reason why Xenu would not run for me. When I disabled that setting, Xenu performed properly.

To disable that setting: Control Panel -> Internet Options -> Advanced (tab) -> HTTP 1.1 settings (list heading) -> Use HTTP 1.1 (checkbox: uncheck it)

24. Can I configure the timeout?

Enter the number of seconds in the [Options] segment in XENU.INI, e.g. as timeout=120. The default value is 60. Note that this isn’t «perfect». Microsoft Windows has a bug so that the timeout can’t be set the way it should. I am using a workaround advice from Microsoft. However I have observed that it doesn’t work if the timeout «hits» while trying to find out if a host name exists.

Alternatively, try this:

  • Start the Registry Editor (REGEDIT.EXE)
  • Go to HKEY_CURRENT_USER \ Software \ Microsoft \ Windows \ CurrentVersion \ InternetSettings
  • Select New > DWORD from the Edit menu
  • Call it ReceiveTimeout with a value of <number of seconds> * 1000
    (The «hidden» default is 300000, i.e. five minutes, which is too long)
  • Restart your system

Some users have complained that if one URL hits a timeout or a failed connection, all URLs from that host also do. Starting with version 1.2h, this behaviour can be disabled by unchecking «fail all URLs with same failed host» in the advanced options dialog. (The default behaviour is «checked»)

25. What about JavaScript?

JavaScript is a programming language, not a formatting language. This makes web pages dynamic; they might depend on the mouse type, the screen size, etc… I have been begged to check simple JavaScript links that have the form javascript:function(‘address’,param1,param2,…,paramN)

My solution, which was first announced in the user group, requires a change in the XENU.INI file. You need a basic understanding of regular expressions (regexp). You must put your regexp in the INI file, like this:

[Options]
Javascript=javascript:.*\([‘»](.*(/|s?html?|gif|jpe?g|png|jsp|cfm|zip|exe|aspx?|pl|pdf|xml|ra|asx|ram|swf|php)(\?.*)?)[‘»](.*)

In the example above, the substring within the first (….) must contain the valid URL.

Frank Visser suggested an improved regexp:

[Options]
Javascript=[j|J]avascript:[_a-zA-Z0-9]+ *\( *[‘»]([^'»]+)[‘»]

Frank Visser has also written a better description on his site.

Note: there may be no blank between within «javascript:function», because the regexp wouldn’t work.

26. What about passwords entered in a FORM?

The software is not able to enter passwords in a FORM. I just don’t see a way to acomplish this easily. I assume it is possible if one combines a set of variable names, values, and a web page that would accept them with a http POST command. But some alternatives might work:
  • Log in with Internet Explorer, start Xenu, then enable cookies in the advanced options dialog (read the details), then start the check
  • If the server accepts authentication with GET (might work with the Tomcat server), try sending such a URL. However, you might still have to activate cookies.
I came up with a new solution for this problem, please give me feedback if it works or if it doesn’t. It was first presented in the user group in April 2009.

Submitting a FORM was never a technical problem for me; I have tested this years ago already, but without any user interface. My mistake was to look for a general way to catch FORMs in HTML pages, instead of just using the login FORM url as a start. I found a somewhat practicable solution at a competing site (WLV).

A test version of Xenu (this may not be the most current version) with login FORMs can be found here

The initial dialogbox has a new checkbox for POST and a POST query string. Note that the query string won’t be stored in the INI file.

Imagine you’d want to check the (imaginary) password protected website https://www.host.com. Look at the HTML for the FORM:

<FORM METHOD=»POST» ACTION=»https://www.host.com/scripts/login.php»>
<INPUT TYPE=»text» NAME=»User»>
<INPUT TYPE=»password» NAME=»Password»>
<INPUT TYPE=»submit» NAME=»Submit» VALUE=»Login»>
</FORM>

Thus, the start URL would be https://www.host.com/scripts/login.php

and if the username is «Xenu», and the password is «Secret», the POST query string would be

User=Xenu&Password=Secret&Submit=Login

(The POST query string gets tricky if there are spaces or special characters in the parameters. It must be URL-encoded)

Important:

  1. You must add https://www.host.com to the inclusion list. If you don’t, only URLs beginning with https://www.host.com/scripts/ will be checked;
  2. Don’t let Xenu hit the logout link! To avoid this, add the logout URL to the exclusion list:
    https://www.host.com/scripts/logout.php
  3. If your server doesn’t do proper URL-rewriting when sessions are disabled, then you must enable cookies in the advanced options dialog;
  4. Don’t let Xenu hit any URLs that delete or change something!

27. How about a WAP version?

Xenu does check .wml files since February 2001.

28. What about these error codes?

I identify only a subset of all possible error codes in the «Status» column. If you get an unknown error code in the Xenu application window, you can scroll to the right for an explanation text.

More information:

29. Why do I get broken links with filelist.xml, editdata.mso and oledata.mso?

Because Microsoft creates these broken links 🙁 Don’t bother with them, or read Knowledge Base article Q219694: Saving Office HTML File to a FrontPage Web Results in a Broken Hyperlink. Or try this tool: Office 2000 HTML Filter 2.0

You can also get rid of the problem by excluding them in the advanced options dialog.
Xenu will exclude URLs that end with /filelist.xml, /editdata.mso and /oledata.mso. (This feature has been available since Version 1.2g)

30. Why do I get «file not found» on remote checks?

There may be several causes for this:
  • Your Internet Explorer isn’t working properly, or is in offline mode, or is blocked by your firewall. Enter the URL you want to check into IE and see if it works.
  • One user got it working by starting Internet Explorer first, and then starting Xenu. I believe that the cause is a broken setup of Windows, or of Internet Explorer.
  • Your temporary directory is full: enter %TEMP% (not «c:\temp» !) into the Windows Explorer, check if there are many TGH*.* files, and delete them.

31. Can I make a foreign language version?

No, please don’t. There’s no guarantee that any of the message texts will be kept in the next version. The other problem is that I didn’t write the software in a way to be language-independent. I could have done it — but I think most people on the web do understand english.

32. Why isn’t Xenu detecting missing URLs?

A web server should return HTTP error 404 for non-existant URLs. Some servers are poorly configured: some redirect to an existing URL with an error message (bad!), others do show an error page, but the server doesn’t return the 404 error (very bad!).

One user had the problem that his Microsoft IIS server didn’t return the 404 error. He found help on this page, and then sent me his solution, which only works in .ASP under IIS:

    <%@LANGUAGE="VBScript"%>
    <% Response.Status = "404 Not Found"
    On Error Resume Next 'important in an error page to prevent another error
    strTarget = Request.ServerVariables("QUERY_STRING")
    strReferer = Request.ServerVariables("HTTP_REFERER") %>
    <HTML><BODY>The page doesn't exist, sorry dude!<BR></BODY></HTML>
The Apache web server has a different (and better) method of doing the same thing using native HTML code for the webpage. You simply set the correct config items in the http.conf file on your box.

Another user with Apache attributed the unwanted redirection to this line in the .htaccess file:

ErrorDocument 404 http://www.host.com/404.html
and he solved it by making this change:
ErrorDocument 404 /404.html
Now he gets a correct 404 error code which includes a tailored error page and no redirection. He read about it here.

33. Running Xenu with Norton Internet Security

A user had trouble to use Xenu with Norton Internet Security 7, and got error 12007 (no such host). After he added Xenu, it worked. This is what he did:
  • added Xenu by opening Norton Internet Security by double clicking the Norton «Globe» Icon
  • In right side panel, «Personal Firewall», Click CONFIGURE
  • In the Personal Firewall pop-up, Click PROGRAMS
  • In PROGRAM CONTROLS MENU
    • Settings for — «Home (Active)»
    • click «Turn on Automatic Program Control» box
    • Under «Manual Program Controls»
    • Scroll to «Xenu.exe»
    • Click Xenu once to Highlight it
    • Click MODIFY
  • in the pop-up:
    • Click PERMIT
    • Click OK
    • Click Ok again
  • Run Xenu

34. Why timeouts?

This is difficult to answer. The cause might be network overload; it might help to set a lower amount of threads, or to fine-tune the DoS detection of your firewall. Check your firewall logs to see whether it detected a «SYN flood» DoS attack by you. SYN is the first data packet that is sent to a host when starting a connection. Theoretically, Xenu might send up to 100 SYN packets that are not immediately answered, so a firewall (that counts «unanswered» SYN packets) might think something «evil» is going on. My firewall box once claimed to have detected a SYN flood when I opened many newspaper articles in background browser windows.

35. Any Spyware, Adware, Malware?

This software exists since 1997 and never had any type of malware. It does not «phone home» or return any statistics to me. There are random «ads» in the HTML report for causes I support; however I don’t get paid for this. Any passwords that you enter in the software (e.g. for orphan search) are not «remembered» after you close Xenu, nor are they passed to me.

Some debug output is stored in the file XENULOG.TXT which you will find in your %TEMP% directory. That file does not contain any passwords and it is used for support (I will sometimes ask you to attach it to an e-mail to me), primarly for problems with the launch of URLs in your browser (especially the report). The file is human-readable, so feel free to have a look. The file is not sent to me by Xenu, it just remains there and you can delete it if you wish.

Here’s a green review by McAfee Siteadvisor about Xenu’s Link Sleuth. Note that until before July 11 2008, Yahoo Search (which uses input from McAfee SiteAdvisor) was redflagging every URL of the whole snafu.de domain, including my user site (this seems to have been corrected now). McAfee SiteAdvisor has redflagged the snafu.de domain, but not the user pages. This was related to three downloads (CuteFTP, GoZilla and Nok2Phone) on the customer support ftp site of snafu.de, who has been my ISP for over a decade. These downloads have been removed since then and both Yahoo and McAfee have been notified. On July 30 2008, I noticed that the snafu.de domain has been greenflagged.

As of 22.8.2009, I was told by a user that Trend Micro Internet Security was redflagging this web page as «Dangerous», because Xenu is a «generic trojan». Such false positives are not an isolated problem, other people have had the same complaint. On August 27 I talked on the phone with a very friendly human from Trend Micro. He explained to me that his software wrongly considers mine to be «another antivirus software» because «it searches» (sure it does!), and that he installed the software on a test machine and understand it is harmless. He promised to «contact the lab». But after that, I was asked to make another support message on another web page, and nothing happened after that, but I haven’t had complaints from any more Trend Micro users since then.

As of 30.10.2009, a McAfee Antivirus product claimed that my product is a «Trojan — Artemis». (McAfee describes this problem: «Artemis» & Other Possibly False Detections) After several complaints, it seemed that the problem had been solved with version 5836 (tested 18.12.2009). As of 21.6.2010, McAfee did it again with the new version 1.3.7, and later with 1.3.8. Despite contacting them, there was no reaction. After finding a different contact page for false alarms, McAfee contacted me the next day (on 14.10.2010) and told me that the false Artemis detection had been removed.

On 21.11.2010, a user of Avira Webguard told me that my download URL was blocked. I found out that it was not blocked by the free antivurus product. After a complaint, it was unblocked two days later.

To put any such «alerts» into the correct perspective, upload any Xenu.exe file to www.virustotal.com, which will check the file against 30 antivirus products.

I’m not the only one «suffering» from this type of libel. Read this blog post by nirsoft.net Antivirus companies cause a big headache to small developers, or this blog by Bill Pytlovany McAfee Continues to Harm WinPatrol Users. This SARVAM blog entry shows that many AV products consider windows system files to be malware when packed.

If you have any more questions about security, don’t hesitate to contact me. If you want to report a bug, click here.

36. How about wildcards in the inclusion and exclusion lists?

This is available but not in the general version. Download it here, however, this may not always be the latest version. Just enter something with a «*» instead of an URL, e.g. «*print*» to exclude an «easy print» version of a web page. Note that only «*» is supported; «?» is not, nor are «regular expressions» (because an average user won’t understand the concept). Also, don’t forget the «*» at the beginning and the end of the URL, unless you want the expression to be a prefix or a suffix.

37. What about CSS?

Styles and CSS files has been supported since version 1.3.8.

Attention: Similar to HTML URLs, the CSS URLs must be «internal» to the root URL, or be added to the inclusion list in the initial dialogbox. For example, if your root URL is http://www.host.com/stuff/ and your CSS URL is http://www.host.com/css/standard.css, then it won’t work — you should then add http://www.host.com/css to the inclusion list.

38. Running Xenu with Norton Security Scan

One user complained that the software was using up all windows handles (32000) on Windows 7 32 bit, and after that he kept getting «no connection». The same happened with browser access. The user told me that it was a new PC. I warned him that new PCs often have some stuff pre-installed. The cause was Norton Security Scan. After deinstalling it, Xenu ran smoothly with 300-600 handles. Apparently, this product isn’t just a scanner, but also a «live watcher», and the product doesn’t free its resources properly.

39. Why are there changing Session-IDs?

Xenu has cookies disabled by default. Thus, if the web server tracks sessions, this would have to be done through the URL. If the session ID constantly changes, then it means your application or your server software is buggy. A properly programmed server does URL rewriting automatically when needed.

To prevent having a new session generated for each new URL, all internal links must be generated dynamically.

In Java servlets, this is done with HttpServletResponse.encodeURL(), which will either change the URL or leave it as it is, depending on wether cookies are enabled or not.

In JSP, you should use the JSP Standard Tag Library (JSTL):

<a href=»<c:url value=’fun.jsp’/>»>Click here for fun</a>

of course you can still do it the hard way, with a scriptlet:

<a href=»<%=response.encodeURL(«fun.jsp»)%>»>Click here for fun</a>

In JSF, you should use the HTML tag library:

<h:outputLink title=»fun title» value=»fun.jsf»>Click here for fun</h:outputLink>
or
<h:link value=»Click here for fun» title=»fun title» outcome=»fun.jsf» />

If you use .php, you should use the SID constant. The manual explains how.

40. Problems in Israel

There is a problem with hebrew websites that happens only on computers with hebrew windows, if the character ת (tav — looks somewhat like PI) is used in URLs. This should be converted to %D7%AA, but is converted into %D7%D7 instead, and only in Israel and not «here» (in Germany).

A fix will be in version 1.3.9. If you can’t wait, use the current beta. Thanks, Yosi!

41. Using an external authentication server

If you are using an external authentication server (e.g. «Sun Access Manager»), make sure that when successful, it doesn’t redirect to an URL that has already been checked by Xenu (and is the one that redirected to the authentication server URL in the first place!).

Alternatively, use the authentication URL (e.g. http://auth.host.com/blah/blahRedirect_WL.jsp?goto=http%3A%2F%2Fwww.host.com%2F.wlforward) as the root URL, and include the «real» root URL (here: http://www.host.com) in the initial dialog box.

42. Running Xenu against the Tomcat server can cause it to hang

I experienced this myself — the cause was a deadlock in log4j. Log4j is usually great, but deadlocks can happen «by design», see this long running ticket and this blog post. The proof that log4j was the cause is that it didn’t happen when logging was set to OFF.

One cause were two JSF Beans that were not serializable. Another was an error message by tomcat about an aborted GET access on /Context/faces/javax.faces.resource/jsf.js?ln=javax.faces». The later cause has been removed in 1.3.9.

43. Why does my page not have any outgoing links?

The following reasons have been observed:
  • The URL is considered external. Note that http://www.host.com is external to http://host.com and vice-versa.
  • A page contains javascript only. You can use the excellent software Fiddler to see what your server delivers to you.
  • A page is delivered to Xenu differently than to a browser. That, too, can be investigated with Fiddler.
  • A page is in 16 bit Unicode (utf-16, which has 2 bytes per character). Xenu does not support this. It is highly unusual, but not illegal. In firefox, you can click on a page with the right mouse key and choose «view page info». If it mentions utf-16, use NOTEPAD to save your page to a different charset (ansi or utf-8). Your page will also have about half the size than before.

Bug List

The software works pretty well, but here the list of things that shouldn’t be.
  • the thread count is sometimes incorrect if the maximum is changed while active
  • the thread count is sometimes incorrect at the end of the session
  • The </A> closing tag must not have spaces or newlines inside
  • leftover TGH*.* files in the %TEMP% directory
  • weird effects when INI file >64K (happens on Windows XP, but works fine on Windows 7 64 bit)
If you find another bug, e-mail me a description, please include the URL you are checking, and if possible try to save your work in a .XEN file and attach it (If it is larger than 1 MB, ZIP it first). Also check http://windowsupdate.microsoft.com to make sure that your system has all the updates. If you want to e-mail a suggestion, click here. You can also join the user group by sending an e-mail to [email protected]

Future feature List

Things I will do in the future (maybe when hell freezes over!):
  • ROBOTS.TXT support
  • Detect remote loading of images (geocities sabotages this)
  • Solution for leftover TGH*.* files in temp directory
  • Command-line parameters (actually, this has already been done, for a client who agreed to pay my development time to two people I support. If you need something similar, e-mail me, the price is a $300 donation to be sent to a person I support)
  • Names of last checked URLs in also file menu
  • Automatic saving every minute
  • A correctly working «Update» feature that rechecks changed sites (tricky, so I will never do it)
  • Ideas from Chris:
    • What about identifying how many steps it takes to reach a particular page from the home page and how much kb had to be downloaded before one could reach there.

    • [TH: useful e.g. to which steps a user must take to reach the page of a particular product]
  • Read RFCs
  • Your suggestions: e-mail me also if there is something of the above you’d like to have, and persuade me to do it. If you want to report a bug, click here.

The Story of Xenu’s Link Sleuth(TM)

(for fellow software developers)
In April and May 1997 my employer assigned me on an out-of-town job, because another department needed a guy with MFC experience. So from monday to friday I was away, and on the evenings I was bored to death. Every week-end I was back home, and I usually checked my web site for broken links with WebAnalyzer. Sadly the software had a lot of bugs, and their support was ignoring my e-mails, and I was mad as hell, as I had spent quite a lot of money on a product that wasn’t worth it. My job was also the first contact with VC++ 4.2 (previously I had only worked with VC++ 1.5, because our customers have a lot of 16bit systems), which had some easy-to-use Internet access classes. I had already experience with WINSOCK programming, but these classes would spare me a lot of time evaluating HTTP result headers and other annoying stuff. On an evening after an excellent italian food with a good chianti I took some hotel letter paper and wrote down a concept for checking links. A month later I took some time to install the development software on my computer and started working, with the help of that hotel-room concept. The work was done on some evenings, but mostly on week-ends, when I had more time.

My philosophy on software development has always been «smaller, simpler, cheaper», long before the NASA realized this (in May 2002 I was told that the actual NASA philosophy was Faster, Better, Cheaper — oops!) Because of that, I need no fancy (but totally useless) graphics like in WebAnalyzer. Just results. And they’d better be 100% correct or I’d have to kill myself 🙂

The application is written in Visual C++, and uses the MFC classes as much as possible: CDocument, CView, CListView, CObArray, CMapStringToOb, CArchive, CInternetSession, CHttpFile, etc, etc. That saved me a lot of time! 


Credits

Original icons in EXE file: Martin Hunt and Paul Campbell; Icon on web page: Erik Plummer; Idea to use banners in report: Marc Cross; Xenu logo button: Fred C.; second Xenu logo button: Charles A. Upsdell; Volcano animated cursor: Juan C. Pradas-Bergnes; Idea & help with SMTP integration: Mark Findlay; SMTP class: P.J. Naughter; Xenu artwork: William C. Chenoweth; WinHelp version of documentation: Andrew Schoenhofer; Regular Expressions: Henry Spencer and Guy Gascoigne; Install and deinstall: Inno Setup NSIS with help from Andrey Aleksanyants; help with Xenu banner: Bruno Zacke; wildcards: Jack Handy; sort icons for list columns: Thomas Holte; new Xenu icon in May 2008: Dominic Raths of Hitflip.de; Idea and code for GraphViz: Kevin Niehage; Current HTML Help (CHM) version of documentation: Andrey Aleksanyants; .jar listing: Arcangelo Bruna; Resize Dialog: Torben B. Haagh; Help with «the Hebrew problem»: Yosi; Internationalising Domain Name conversion: Gisle Vanem and Adam M. Costello; duplicate content detection: RSA Data Security, Inc. MD5 Message-Digest Algorithm; gzip content decompression: zlib; sitemap tree css: Ross Angus.

Links for further reading

Trademarks

Xenu, Xenu’s Link Sleuth and Link Sleuth are trademarks used by Tilman Hausherr for software products and services. These products are not associated in any way with services licensed by RTC, CoST, BPI, CSI, etc.


Home | $cientology | Magic | Mozilla | Tilman | Deutsch | Bookstore

tilman at snafu dot de

Проводим аудит внутренней структуры сайта программой Xenu Link Sleuth — Devaka SEO Блог

161К просмотров

Xenu Link Sleuth это один из наиболее полезных инструментов в поисковой оптимизации. Хотя эта программа изначально предназначалась для поиска битых ссылок на сайте, с помощью неё можно решать ряд других задач, проводя аудит внутренней структуры сайта и находя в нем слабые места:

– Искать битые (неработающие) ссылки на заданном ресурсе.
Вы написали сотню статей, во многих были ссылки на другие ресурсы или какие-нибудь документы, изображения, но уследить за работоспособностью всех этих ссылок вручную невозможно. В данном случае очень удобно использовать Xenu Link Sleuth, как свободный софт, простой в настройке и использовании.

– Составлять карту сайта.
Для динамических сайтов составить карту не составляет проблемы, однако, для статических HTML ресурсов создавать карту сайта вручную весьма долго и трудоемко. Xenu решает эту задачу за несколько минут в зависимости от размера сайта и скорости Интернет-соединения.

– Искать страницы с большим временем отдачи.
Зная, какие страницы на вашем сайте отдаются с большой задержкой, можно проанализировать причину подобного поведения и оптимизировать время отдачи, что положительно скажется как на посетителях, так и на поисковых системах.

– Найти неуникальные тайтлы.
Каждый тайтл на странице должен быть уникален, тогда ни одна из них не будет находиться в дополнительных результатах поиска и фильтроваться, как дублированный контент. Поэтому важно знать, на каких страницах сайта тайтлы повторяются.

– Найти страницы с большим уровнем вложенности.
Все страницы на сайте по возможности должны находиться не далее, чем в двух-трех кликах от главной. Чем дальше находится страница, тем сложнее до неё добраться как пользователям, так и поисковым системам. Если у вас нашлись подобные страницы, являющиеся важными, но находящиеся далее, чем в 3-х кликах от главной, стоить принять какие-либо меры для улучшения навигации. Возможно, некоторые из дальних страниц вам уже не нужны, xenu легко позволяет их найти.

– Искать страницы с максимальным количеством исходящих ссылок.
Как упоминалось раннее, все исходящие ссылки на сайте должны тщательно модерироваться, так как от них зависит заслуженное доверие от поисковых систем (по принципу: “Скажи мне кто твой друг и я скажу кто ты!”) а также присвоение сайту различного рода фильтров. Если вы заметили резкое падение позиций в поисковике, тогда первым делом необходимо проверить все исходящие ссылки, так как возможно, если виноваты не вы, то хакеры, разместившие на вашем ресурсе свои спам-ссылки.

– Посмотреть какие из страниц имеют наибольшее и наименьшее количество внутренних ссылок на себя.
Проверьте вашу внутреннюю перелинковку в численном виде. Какие из страниц заслужили больше внимания, а какие меньше (исходя из внутренних ссылок)?

– Найти картинки с отсутствующим атрибутом alt.
Атрибут alt является важным при оптимизации сайта или отдельных страниц под определенные запросы. Проверьте, возможно, вы упустили описание для важных на вашем сайте изображений, добавив которое, вы улучшите позиции в поиске, либо вас будут находить по поиску по изображениям.

Результаты решения этих задач, как видно, могут быть использованы для оптимизации, поэтому, сделаем небольшой обзор программы Xenu Link Sleuth, чтобы её пользователей не пугал английский интерфейс.

Ксену является свободным продуктом и эту программу можно скачать по этой ссылке. При запуске перед вами откроется очень простое окно, важная часть которого изображена на скриншоте.

Чтобы начать аудит какого-либо сайта, выберите пункт меню “File » Check URL”. В появившемся окне необходимо ввести адрес сайта и выделить чекбокс “Check external links” (проверять внешние ссылки).

В программе предусмотрено множество настроек, доступных в пункте меню “Options » Preferences”.

Parallel threads устанавливает количество синхронных (параллельных) запросов.
Apply to all jobs позволяет сохранять настройки для всех проектов.

Далее, отчет позволяет включать в себя:
Broken links, ordered by link — Битые ссылки, отсортированные по адресу;
Broken links, ordered by page — Список битых ссылок, отсортированных по страницам;
Broken local links — Битые внутренние ссылки;
Redirected URLs — Адреса с 301/302 редиректом;
Ftp and gopher URLs — ФТП и другие не HTTP адреса;
Valid text URLs — Список рабочих текстовых ссылок;
Site Map — Карта сайта;
Statistics — Статистика;

Файл отчета работы Xenu очень большой и содержит в себе всю необходимую информацию. К примеру, статистика мониторинга моего блога показала следующие результаты:

В результате аудита, на сайте найдены ряд моментов, на которые стоит обратить внимание для оптимизации. Единственный недостаток программы — отображение русских заголовков страниц в неправильной кодировке.

Сразу же после окончания проверки ссылок сайта, в главном окне появится детальная таблица, где данные можно отсортировать по каждому из столбцов: адрес ссылки, возвращаемый статус, mime-тип, размер, заголовок, уровень вложенности, кол-во внешних и внутренних ссылок, время отдачи страницы. Вот эту таблицу вам и надо использовать. Если что-то будет не понятно по работе или использованию программы, можете спрашивать в комментариях, постараюсь ответить.

Xenu’s Link Sleuth: программа проверки веб-сайта на «битые» ссылки

На каждом сайте могут появляться так называемые «битые ссылки» (англ. «broken links»), которые ведут на несуществующие веб-страницы как на этом сайте, так и на других сайтах в Интернете.

В каких случаях появляются такие ссылки?

«Битая» или «мертвая ссылка» может появиться после изменения структуры сайта (удаления или изменения адресов страниц или целых разделов), при этом на какой-то из страниц остается ссылка, указывающая на старый адрес страницы. Такие ссылки могут быть как «внутренними» (ведущими на несуществующие страницы этого же сайта), так и «внешними» (ведущими на несуществующие страницы другого сайта). И в том и в другом случае, задача вебмастера — найти и исправить такие ссылки, чтобы не вводить в заблуждение посетителей.

Как же можно найти «битые ссылки»?

Если на сайте немного страниц и на каждой находится не более 2-3 ссылок, их можно периодически проверять вручную. Но если на сайте сотни страниц, на каждой из которых имеются с десяток ссылок, такая проверка может превратиться в проблему. В этом случае ппоиск битых ссылок лучше это делать специальной программой. Об одной из таких программ с названием Xenu’s Link Sleuth я и хочу вам рассказать.

Программа Xenu’s Link Sleuth позволяет найти битые ссылки, изображения, фреймы, дополнительные модули (plug-ins), фоновые рисунки (backgrounds), графические карты сайта (local image maps), таблицы стилей (style sheets), скрипты и Java-апплеты. Программа выводит список проверенных ссылок с сортировкой по различным параметрам. Также она позволяет создавать отчет с результатами проверки.

Преимущества программы:

  • Программа бесплатна (freeware)
  • Простой и удобный пользовательский интерфейс
  • Возможна повторная проверка битых ссылок (это удобно при временной недоступности проверяемого сайта)
  • Простой формат отчета
  • Размер исполняемого файла программы меньше 1Мб
  • Возможность проверки защищенных сайтов по протоколу SSL («https://»)
  • Определение и вывод редиректов (т.е. пересылок на другие страницы)
  • Возможно формирование карты проверяемого сайта

Системные требования: Microsoft Windows 95/98/ME/NT/2000/XP/Vista/7, (для работы требуется библиотека WININET.DLL, входящая в состав Internet Explorer). Также программа работает под Red Hat 8 и Ubuntu с помощью wine, и под Mac с помощью Crossover.

Запуск программы

После клика на значке программы появляется ее главное меню.

Для проверки сайта нажимаем клавиши Ctrl+N или жмем на крайнюю слева кнопку «Check URL». Открывается окно, где мы указываем адрес сайта, который необходимо проверить на «битые ссылки». Если адрес сайта заканчивается названием каталога, не забудьте добавить в конце строки символ ‘/’ или будет проверен весь родительский каталог. Например:

Правильно: http://www.host.com/user/

Неправильно: http://www.host.com/user

Настройки программы:


  • Local file — выбрать для проверки сохраненную веб-страницу.
  • Check external links — дополнительно к «внутренним» будут проверяться все «внешние» ссылки.
  • Consider URL’s beginning with this as «internal» — добавить список ссылок, которые программа будет считать «внутренними». Ввод каждой такой ссылки завершается нажатием на кнопку «Add».
  • Do not check any URL’s beginning with this — добавить список ссылок или разделов, которые программа НЕ будет проверять. Ввод каждой такой ссылки завершается нажатием на кнопку «Add».
  • More options — открыть окно с дополнительными настройками (см. ниже).

После зажатия на кнопку «OK» начнется поиск битых ссылок на сайте, который может занять, в зависимости от числа страниц сайта, скорости их загрузки и числа ссылок на каждой из них, от нескольких секунд до нескольких часов.

На экране появляется список найденных на сайте ссылок, каждая из которых выделяется определенным цветом:

  • серая — ссылка находится в очереди на проверку или исключена из проверки в соответствии с заданными настройками
  • зеленая — ссылка доступна
  • красная — найдена «мертвая» ссылка или ссылка временно недоступна.

Перемещаться по списку можно с помощью клавиш управления курсором (Вверх, Вниз, PageUp, PageDown) или находящейся справа полосы прокрутки.

Внизу окна в строке статуса выводится общее количество найденных и обработанных ссылок и время, прошедшее с начала проверки.

По окончанию проверки выводится соответствующее сообщение и запрос на формирование отчета:

Дополнительные настройки программы:

  • Parallel Threads — число параллельно запрашиваемых страниц (рекомендуется 1 — 3, слишком большое значение может привести к значительной нагрузке на сервер и замедлению скорости загрузки страниц)
  • Ask for password or certificate when needed — при необходимости запрашивать пароли и сертификаты (используется для защищенных сайтов и разделов)
  • Treat redirections as errors — считать редиректы ошибками
  • Report — информация, которую необходимо выводить в отчет (можно указывать пункты согласно рисунку)
    • Broken links, ordered by links — показывать «битые» ссылки, отсортированные по адресу ссылки
    • Broken links, ordered by page — показывать «битые» ссылки, отсортированные по адресу страницы
    • Broken local links — показывать»битые» локальные ссылки
    • Redirected URLs — показыватьссылки с редиректами
    • Site Map — строить HTML-карту сайта (при большом количестве проверяемых страниц может привести к значительным задержкам времени при формировании отчета)
    • Statistics — выводить в отчет различную статистическую информацию

Полученный отчет открывается в вашем браузере и состоит из разделов, которые были заданы в настройках программы:

Если было задан вывод статистической информации, то добавляется соответствующий блок.

В статистике указано количество проверенных страниц с группировкой по их типам (HTML-страницы, изображения, скрипты, файлы и т.п.), суммарные размеры страниц. Также указывается количество найденных ссылок с группировкой по их типам:

  • ok — страница найдена;
  • skip external — страница пропущена как «внешняя»;
  • forbidden request — доступ к странице запрещен;
  • not found — страница не найдена.

Полученный отчет можно сохранить для дальнейшей обработки в Excel.

Xenu (Xenu’s Link Sleuth) – что это за программа, для чего нужна

Xenu Link Sleuth– бесплатная англоязычная программа для быстрого SEO-аудита сайта.

Основной функционал сервиса

  • Поиск битых ссылок на сайте,
  • Составление карты сайта,
  • Поиск страниц с медленной загрузкой,
  • Поиск неуникальных заголовков страниц,
  • Поиск страниц с большим уровнем вложенности (более 3-х кликов от главной страницы),
  • Поиск страниц с большим количеством исходящих ссылок,
  • Проверка внутренней перелинковки,
  • Поиск картинок с незаполненным атрибутом alt.

Xenu формирует отчеты как в собственном файловом формате, так в текстовом для дальнейшего экспорта в Excel.

Как работать с Xenu

Программа является свободно распространяемой, и можно скачать Xenu с любого понравившегося сайта.

После установки программы на компьютер можно начинать проверку ресурса.

Для начала работы нужно выбрать в верхней панели слева значок «Check URL»:

В появившемся окне в самое первое поле вводим нужный URL либо выбираем файл с компьютера:

Галочка «Check external links» означает, что сервис также проверит внешние ссылки на сайт, поэтому ее лучше не снимать.

Блок «Include/Exclude» позволяет добавлять URL или наоборот исключать из проверки.

Если нужна не полная проверка сайта, можно выбрать, что включить в итоговый отчет, нажав на кнопку «More options»:

  • Ползунок «Parallel threads» задает количество синхронных (параллельных) запросов.
  • Галочка «Apply to all jobs» позволяет сохранять настройки для всех проектов.

Также после проверки можно отправить отчет на email:

Как только все нужные поля и опции заполнены, можно нажимать «ОК», запуская проверку сайта.

Данные в появившемся отчете можно сортировать с помощью табуляторов вверху, что позволяет быстро получать самую разную информацию:

  • Сортировка по «Status» поможет найти битые ссылки.
  • Сортировка по «Type» покажет изображения без атрибута alt.
  • Сортировка по «Size» найдет самые тяжелые страницы.
  • Сортировка по «Title» покажет страницы с дублированными заголовками.
  • Сортировка по «Level» позволит просмотреть вложенность страниц сайта.
  • Сортировка по «Out Links» покажет количество исходящих ссылок с той или иной страницы своего ресурса (узнать, на какие именно страницы проставлены ссылки, можно из контекстного меню).
  • Сортировка по «In Links» покажет количество входящих ссылок на любой документ своего ресурса (узнать, откуда ссылки, можно из контекстного меню).

В результате проверки Xenu также формирует HTML-отчет, где представлена информация по битым ссылкам и карта сайта:

Находим битые ссылки с помощью программы Xenu’s Link Sleuth

Битая ссылка – это ссылка, которая делает переход на не существующую страницу сайта, изображение или документ. Сразу появляется сообщение – страница не найдена (ошибка 404). На сайте могут присутствовать внешние ссылки на сторонние ресурсы.

Интернет ни дня не стоит на месте – все меняется, появляются новые и новые блоги, сайты, картинки и т.д. Ровно столько же исчезает или удаляется внешних источников, поэтому переход по ссылке никуда не приведет. Внешняя ссылка становиться битой.

Следовательно, нужно проверить сайт на битые ссылки, ведь не всем пользователям понравиться тратить свое время на поиск нужной информации, а потом увидеть сообщение о том, что запрашиваемая страница не найдена или не существует.

К чему может привести наличие на сайте битых ссылок?

1. Очень негативно реагируют на битые ссылки поисковые системы, в частности Яндекс и Google. Этот «мусор» снижает позицию сайта в поисковой выдаче. Если на сайте несколько таких ссылок – ничего страшного, а если счет идет на сотни?
2. Второе – это уменьшает посещаемость страницы. Если посмотреть на проблему глазами пользователей, то кто захочет потратить уйму времени на поиск нужного документа, изображения или еще чего-нибудь, а потом попасть на станицу с «ошибкой 404». Наверное, любой из нас закроет данный сайт с разочарованием и больше не вернется сюда.

Как проверить сайт?

Для того чтобы решить проблему, нужно проверить битые ссылки на интересующем ресурсе. Для данной задачи можно воспользоваться одной из специальных программ, например Xenu’s Link Sleuth. Данная программа качественно и быстро выполнит поиск всех битых ссылок.

1. Скачиваем программу Xenu’s Link Sleuth.
2. После установки открывается окно программы, где в меню File нужно выбирать пункт Check URL:

3. В окошке вводится адрес нужного сайта, для которого будет выполнена проверка битых ссылок. Устанавливается флажок напротив пункта «Check external links». Нажимается кнопка «ОК»:

4. Программа выполнила проверку на битые ссылки на сайте. Они отмечены красным цветом:

5. Выполняется проверка битых ссылок на сайте. Для того чтобы удобнее было просматривать результат, в программе сортируют результат – нажимают на столбик с названием «Status». Все битые ссылки отсортированы по порядку – они красного цвета:

6. Программа Xenu’s Link Sleuth имеет много опций, поэтому можно найти не уникальные названия всех страниц проверяемого сайта – нажимают на столбец с названием «Title». В результате показаны все дубликаты названий:

7. Для активного сайта не желательно, чтобы страницы и изображения на нем имели большой вес. Это помешает загружать станицу тем пользователям, у которых нет хорошего подключения к интернету. Для поиска проблемных мест, нажимают столбец «Size»:

8. Проверяют программкой и количество страниц, которые ссылаются на данную страницу – кликнуть нужно по «In Links»:

9. Узнают число исходящих ссылок на страницах сайта, выбирая столбик «Out Links»:

10. Для того чтобы узнать вложенность страницы на сайте – есть столбик «Level», который показывает уровень страницы:

11. Чтобы сайт чаще выбивался в результаты поиска, нужно чтобы все изображения были с названиями. Поэтому находят такие изображения, кликая по столбцу «Type».

Удачи Вам!

Xenu link sleuth русская версия. Программы Xenu’s Link Sleuth и Netpeak Spider

Xenu’s Link Sleuth — старый надежный crawler, который быстро просканирует сайт и найдет буквально все: битые ссылки, редиректы, ошибки и многое другое.

При проверке сайта важно найти и исправить все ошибки, битые ссылки и неправильные редиректы, так как их отсутствие является положительным факторов в ранжировании сайта.

Хочу посоветовать отличный софт: — старый надежный crawler, который быстро просканирует сайт и найдет буквально все : битые ссылки, редиректы, ошибки, зашированные url, размер документа, дату и многое другое. Последняя версия от 2010 года, но это не мешает Xenu находит больше ошибок за меньшее количество времени, чем многие современные аналоги.

Но это не все, у программы есть множество дополнительных настроек, например:

  • Мы можем регулировать скорость анализа и количество потоков
  • Выводить более детальную статистику о каждой странице сайта. Например, чтобы показывать все редиректы, нужно зайти в «Options» — «Preferences» и поставить галочку «Treat redirections as errors» — тогда все редиректы будут отображаться как ошибка и отдавать ответы 301 или 302:


  • В Xenu мы можем создавать статичную html и xml карту сайта
  • Конвертировать отчет в формат Excel и сортировать полученные данные

На последнем пункте остановимся поподробнее. Чтобы открыть отчет в Excel нужно экспортировать отчет «File» — «Export to TAB Separated File»:


Получим отчет в обычном.txt файле — его нужно открыть Notepad++ (или аналогом) и сменить кодировку на ANSI:


После этого можно спокойно открывать файл в Excel:


Где мы уже можем сортировать данные как нужно: по дате появления документа, по количеству внешних ссылок, по уровню вложенности страницы и т.д.

Здравствуйте, уважаемые читатели блога сайт. Многие думают, что битые ссылки — это не самая животрепещущая тема для вебмастера, ибо всегда найдется что-то более важное и значимое, чем вам будет предпочтительней заняться.

Да и утомительно это — искать программу, расширение или онлайн-сервис, где осуществляется проверка, а затем долго и муторно отыскивать доступ и проводить правку найденных нерабочих гиперссылок на своем ресурсе.

В принципе, гораздо проще забить на эту проблему, ибо маловероятно, что они присутствуют на вашем проекте в огромных количествах и их влияние вряд ли как-то скажется на отношение посетителей и поисковых систем . Или же все-таки скажется? Быть или не быть битым ссылка на вашем сайте?

Я считаю, что это есть зло, от которого нужно периодически избавляться (очищаться). Но по-любому вам решать, я лишь опишу те методы, которые использовал и использую для упрощения сего процесса.

Проблема битых ссылок и причина их появления

Вообще вопрос об отношении к битым ссылкам довольно интересный, ибо однозначной информации по этому поводу нет. Но если судить по тому, что в панелях для вебмастеров Яндекса и Google имеется раздел, где будут приведены все найденные нерабочие ссылки на вашем сайте, то это уже можно считать первым признаком того, что поисковикам они вовсе не по барабану.

Думаю, что при большом их количестве поисковые системы могут посчитать ваш сайт заброшенным и понизить его в выдаче. Так ли это на самом деле я не знаю, но даже то, что битые ссылки представляют существенное неудобство для посетителей (тем самым ухудшая ПФ), может служить достаточно весомым аргументом к тому, чтобы всерьез задуматься об их выявлении и исправлении.

Конечно же, сделать это вручную (пройтись по всем внутренним и внешним ссылкам, ведущим со станиц вашего сайта) не представляется возможным даже на очень маленьких проектах, не говоря уже о больших порталах. Проверка — это прерогатива программных средств — ботов поисковых систем, онлайн сервисов или специально для этого написанных программ, скриптов или расширений (плагинов) для используемого вами движка сайта.

Но все равно, даже после того, как все нерабочие гиперссылки будут найдены, решение об их исправлении или удалении придется принимать именно вам, и по каждой из них в отдельности. Поэтому, если решитесь на данную проверку, на всякий случай запаситесь терпением и некоторым количеством времени.

Если говорить о причине появления битых ссылок на сайте , то в случае блога сайт это в основном мои собственные ошибки при осуществлении ручной внутренней перелинковки, а также внешние ссылки на ресурсы авторов комментариев и упоминаемые в статьях онлайн-сервисы, которые успели за это время кануть в лету (ребят, знали бы вы, сколько сайтов сгинуло за те семь лет, что существует мой блог — реально становится грустно!).

Встречаются и другие варианты их появления. Вообще, причиной неработающих линков могут быть и изменения Урлов на сторонних ресурсах без использования 301 редиректа для склеивания нового адреса со старым (при изменении структуры сайта, переноса статей между разделами и т.п.), да и много других сугубо индивидуальных проблем.

Как я уже упомянул чуть выше, существует несколько способов, с помощью которых можно проверить свой проект на наличие подобных изъянов. Самым очевидным мне кажется воспользоваться тем списком нерабочих ссылок, который собрали боты поисковых систем.

Ищем битые ссылки в Яндекс Вебмастере и Search Console Гугла


В панелях вебмастеров Яндекса и Google можно будет узнать, на каких страницах и какие именно нерабочие гиперссылки были найдены, а затем, по возможности, внести необходимые исправления в админке своего проекта.

Про работу с панелями для вебмастеров Яндекса и Google я уже довольно подробно писал, поэтому позволю себе лишь привести линки на эти материалы:

  1. (в ближайшее время ее придется обновлять, ибо Яндекс наконец-то допилил новую версию)

Давайте начнем проверку с инструментов для веб-мастеров от Google. Будем считать, что воспользовавшись приведенными выше материалами, вы уже добавили свой ресурс в панель Гугла , и теперь вам останется лишь пройти из левого меню в «Сканирование» — «Ошибки сканирования» :

На открывшейся странице перейти на вкладку «Не найдено» , где и будут сосредоточенны все нерабочие, по мнению Google, ссылки на вашем проекте. Но тут следует понимать, что поисковик рассматривает не только линки ведущие с вашего сайта, но и все те, что были проставлены с других ресурсов (так называемые ).

Т.о. в списке не найденных документов будут присутствовать Урлы, полученные не только в результате ваших собственных ошибок при внутренней перелинковке, но и результаты ошибок тех пользователей, которые второпях поставили на вас ссылку со своего сайта или чужого форума, но не проверили ее работоспособность.

Напротив каждого не найденного документа вы увидите код ошибки 404 (читайте про то, что тоже может являться выходом из сложившегося положения). Посмотреть Урл страницы, которую Гугл не смог найти на вашем ресурсе, можно щелкнув по любой строке.

Там же на вкладке «Ссылающиеся домены» вы можете найти страницы, с которых данная битая ссылка была проставлена.

Если в открывшемся окне вы увидите адреса вебстраниц не вашего сайта, то исправить, скорее всего, ничего не сможете (хотя, можно попробовать, например, в.htaccess настроить для таких битых ссылок 301 редирект на правильный Урл). Но если нерабочие гиперссылки были проставлены со страниц вашего же собственного ресурса, то нужно будет в админке найти требуемую статью (или комментарий к ней) и поправить, либо удалить некорректный линк.

Думаю, что разберетесь, но наравне с панелью инструментов Google не примените посмотреть информацию о не найденных документах и в панели для вебмастеров от Яндекса, ибо их данные могут отличаться.

В Яндекс Вебмастере вам нужно будет перейти в левом меню на «Индексирование» — «Внутренние ссылки» , а в открывшемся окне из выпадающего списка можно будет выбрать фильтр по типу ошибок (ошибки сервера, либо отсутствие страницы или запрет на ее индексацию):

Вы увидите список всех найденных страниц в том числе и с ошибкой 404. Далее идете в админку своего ресурса, отыскиваете нерабочую гиперссылку и либо исправляете ее, либо удаляете, чтобы не вносила сумбур в работу отлаженного механизма.

Проверка битых ссылок в программе Xenu Link Sleuth

Я мог бы еще упомянуть в этой статье про ряд сервисов, позволяющих проверить битые линки онлайн, но, к сожалению, я так и не нашел достойного бесплатного решения (хотя все же один вариант рассмотрю чуть ниже, ибо он позволяет быстро пробежаться по наиболее «выпирающим» битым ссылкам), а пробовать платные у меня как-то рука не поднялась. На бесплатных же проверить можно очень ограниченное число страниц, а следовательно, актуальность такого способа весьма сомнительна.

Но можно ведь использовать не только онлайн-сервисы, но и программы, которые будут установлены на ваш компьютер. Одной из самых популярных и, что очень важно, бесплатных программ для проверки битых ссылок является Xenu Link Sleuth, о которой я и хочу вам рассказать.

скачать Xenu Link Sleuth и установить на свой компьютер.

После ее запуска выберите из меню «File» — «Check URL» и в открывшемся окне введите URL вашего ресурса, поставьте галочку «Check external links» (для проверки на битость не только внутренних линков вашего ресурса, но и ссылок, ведущих с него на другие ресурсы) и нажмите «ОК».

В результате программа Xenu Link Sleuth начнет искать и анализировать все внутренние и внешние (проставленные с вашего ресурса, например, на сайты авторов комментариев) ссылки. Все найденные неработающие гиперссылки в результирующем отчете будут помечены соответствующим образом (не найдено, не удалось связаться и т.д.).

Сам по себе отчет представляет неоценимый интерес не только с точки зрения ошибок 404, но нас в первую очередь интересует именно это. В окне Xenu Link Sleuth имеется возможность отсортировать весь список по ряду табуляторов, которые находятся в самом верху.

Для проверки именно битых ссылок нужно будет воспользоваться табулятором «Status», в результате чего все помеченные красным строки будут собраны в одном месте списка.

Для того, чтобы узнать, а на какой именно странице вашего сайта проставлена неработающая гиперссылка, вам нужно щелкнуть по ней правой кнопкой и выбрать из контекстного меню вариант «URL Properties» :

В самом низу открывшегося окна вы увидите список адресов страниц вашего сайта, на которых была найдена данная битая ссылка. Вам останется только зайти в админку своего ресурса и провести необходимую правку. Да, муторно. Да, неудобно, ибо приходится копипастить ссылки и искать в админке нужные страницы. Но потратив время и силы вы на 100% избавите свой сайт от битых ссылок (во всяком случае, имеющих место быть на данный момент).

Но, как я уже упоминал чуть выше, программа Xenu Link Sleuth, при должном подходе и сообразительности, способна предоставить намного больше информации. Если вы поэкспериментируете с другими табуляторами программы, то сможете получить следующую информацию о вашем сайте из этого отчета:

  1. если вы попробуете отсортировать данные в окне программы по табулятору «Title», то таким способом можете найти страницы своего сайта, имеющие дублированные заголовки Title или не имеющие их вовсе
  2. с помощью табулятора «Size» можно найти слишком тяжелые страницы своего проекта, которые будут долго загружаться
  3. с помощью табулятора «In Links» можно узнать количество входящих ссылок на любой документ своего ресурса, а из контекстного меню (щелчок правой кнопкой и выбор самого нижнего пункта в открывшемся меню) можно будет узнать и адреса страниц, ссылающихся на этот документ
  4. с помощью сортировки табулятором «Out Links» в окне отчета программы Xenu Link Sleuth сможете узнать количество исходящих ссылок с той или иной страницы своего ресурса, а из контекстного меню — посмотреть, на какие именно страницы проставлены ссылки
  5. отсортировав по табулятору «Type», можно найти изображения не имеющие тега Alt
  6. табулятор «Level» позволит просмотреть вложенность тех или иных страниц вашего сайта

В общем, Xenu Link Sleuth имеет просто неоценимую значимость. Кроме этого, для статического сайта эта программа может , которую потом можно будет подсунуть поисковым системам для ускорения индексации.

Также Xenu Link Sleuth по результатам проверки может сформировать очень удобный отчет в виде Html странички, где можно будет в удобоваримом виде просмотреть все веб-страницы своего проекта, имеющие битые ссылки и увидеть упомянутую выше карту.

Для создания отчета вам нужно выбрать в меню программы пункты «File» — «Report» или просто нажать R на клавиатуре. В верху страницы с отчетом будет расположено меню с разделами.

Поиск ссылок в WordPress с помощью Broken Link Checker

Если у вас , то возможно вам будет удобнее воспользоваться плагином Broken Link Checker для проверки неработающих гиперссылок. Он может осуществлять повторную проверку через указанный вами промежуток времени, прекращать свою работу в моменты, когда сервер вашего хостинга сильно нагружен, и, что самое важное, позволяет исправлять или удалять битые ссылки прямо из своего окна, не требуя захода в окно редактирования статей.

Итак, сначала вам нужно будет скачать Broken Link Checker и стандартным образом. Если возникнут с этим проблемы, то можете обратиться к приведенному по ссылке материалу.

Сразу после установки он начнет работать и сканировать ваш блог на наличие битых ссылок. Зайдя на страницу настройки этого плагина («Настройки» — «Проверка ссылок») в админке Вордпресса, вы сможете увидеть, сколько гиперссылок уже нашел Broken Link Checker на вашем блоге, а также сделать необходимые настройки.

Здесь вы можете задать частоту повторного сканирования, попросить посылать вам сообщение на E-mail при обнаружении недоступной страницы, а также попросить плагин выделять найденные гиперссылки с помощью особого стиля CSS.

Но у Broken Link Checker есть еще несколько вкладок с настройками. На вкладке «Look For Links In» вы можете задать, в каких именно материалах вашего блога он будет осуществлять поиск, а на вкладке «Which Links To Check» указать, ссылки с каких объектов будут проверяться. На вкладке «Дополнительно» вы можете максимально минимизировать нагрузку этого плагина на сервер хостинга , ограничив время поиска и задав порог загруженности сервера, при превышении которого он прервет свою работу.

По мере проверки будет предоставляться отчет о проделанной работе и найденных битых ссылках, который вы сможете посмотреть, перейдя в меню админки WordPress в «Инструменты» — «Неправильные ссылки» :

Здесь у вас будут богатые возможности по работе с ними, причем все, что вам может потребоваться (отредактировать, удалить ее, перейти к материалу, в котором проставлена данная битая ссылка), будет возможно сделать прямо отсюда, никуда не переходя и ничего не ища. В этом и состоит, на мой взгляд, основное преимущество плагина Broken Link Checker. К тому же, по окончании проверки его со спокойной душой можно снести до следующей проверки, чтобы глаза не мозолил. Думаю, что для Joomla тоже должны существовать аналогичные расширения, но я, к сожалению, с ними пока не знаком.

Онлайн-сервис Broken Link Checker

Ну, и напоследок, как и обещал, опишу один из множества онлайн-сервисов предназначенных для поиска битых ссылок на любом сайте. Не сказать, чтобы сервис этот чем-то особым выделялся или как-то по особому хорошо работал. Нет. Но зато поиск битых линков в нем довольно прост и находит он их, как правило, не много, чтобы, наверное, нас не слишком расстраивать. Я обычно использую сначала его (проверяю несколько раз подряд), а уже потом использую плагин и программу (для лакировки, так сказать).

Итак, заходите на Broken Link Checker , вводите Урл вашего сайта в форму расположенную в правом верхнем углу открывшейся страницы и жмете на кнопку «Find broken links». Откроется страничка, где нужно будет разгадать капчу и выбрать один из двух способов проверки (детальное отличие не понятно, но имеет смысл по очереди оба варианта прочекать). Еще раз жмете на заветную кнопочку и наблюдаете за результатом проверки, либо идете по своим делам не закрывая эту вкладку в браузере.

Сервис Broken Link Checker будет вам сообщать о количестве проверенных страниц и потихоньку начнет выводить список найденных битых ссылок. Править их можно начинать прямо сейчас не дожидаясь окончания процесса проверки. Для этого достаточно будет кликнуть по кнопке «src» в нужной строке списка:

В результате вы увидите исходный код страницы (на нее саму можно попасть кликнув по соседней кнопке «url»), где найдена битая ссылка. Причем место размещения в коде будет подсвечено:

Все. Останется только найти в тексте статьи или в теле комментария проблемную ссылку, еще раз проверить ее неработоспособность и пофиксить Broken Link как будто бы его и не было. Усё.

Удачи вам! До скорых встреч на страницах блога сайт

Вам может быть интересно

Делаем ручную перелинковку страниц в WordPress более комфортной с помощью плагина WP-MFC Linkator
Создание в WordPress карты блога для посетителей (плагины Sitemap Generator и WP DS Blog Map) SEO PowerSuite — программы для внутренней (WebSite Auditor, Rank Tracker) и внешней (SEO SpyGlass, LinkAssistant) оптимизации сайта
Хлебные крошки в WordPress средствами плагина Breadcrumb NavXT (усиливаем перелинковку)
WP-PageNavi — постраничная навигация для блога на WordPress — установка, настройка и изменение внешнего вида пагинации
Better Feed для WordPress — как не отдавать в RSS полные тексты постов и защититься от воровства контента через новостной канал
Comment Toolbar — добавляем в комментарии WordPress возможность ответа и цитирования
SEObar — удобный и информативный SEO плагин для Оперы
Создание списка похожих материалов в WordPress (с миниатюрами) при помощи плагина Related Posts для внутренней линковки

Xenu – это сокращенное название программы Xenu’s Link Sleuth, предназначенной для внутреннего аудита сайта и поиска битых ссылок.

При изменении структуры сайта или URL-адресов на других страницах могут оставаться неактуальные ссылки, ведущие на старые несуществующие адреса. Именно поиск таких ссылок и является основной задачей Xenu. Программа является бесплатной, потому она очень популярна во всем мире. Это простой софт, позволяющий в короткие сроки проанализировать сайт на наличие битых ссылок и не только.

Возможности Xenu

Помимо поиска неработающих и битых ссылок, программа умеет:

  • искать изображения, фреймы, скрипты, плагины, стили и др.;
  • искать страницы с большим временем отклика;
  • искать страницы с большим весом;
  • искать страницы с большим уровнем вложенности;
  • проводить анализ внутренней перелинковки;
  • искать одинаковые заголовки Title;
  • искать изображения без атрибута alt;
  • составлять карту сайта;
  • проверять защищенные сайты по протоколу SSL (https://).

Xenu способна анализировать как весь сайт, так и его отдельные страницы. Также есть возможность проанализировать локальные документы на ПК.

В процессе анализа в основном окне будут отображаться результаты. В дальнейшем их можно будет экспортировать, допустим, в Excel.

Как работает программа

Чтобы начать анализ сайта в Xenu, необходимо запустить софт и нажать на вкладку File. Далее выбрать первый пункт Check URL.

Указываем адрес сайта, отдельных страниц или путь к документу на ПК.

После запуска в основном окне программы будут отображаться результаты анализа. Анализироваться будут как URL-адреса страниц, так и ссылки на различные файлы.

С помощью различных табуляторов вы сможете отсортировать ссылки по разным параметрам: Status (битая или нет), Type (формат файла), Size (размер страницы), Title (заголовок) и Level (уровень вложенности).

XENU Link Sleuth 1.3.8 – скачать бесплатно программу для обнаружения «битых» ссылок на сайте. Программа предназначена в первую очередь для веб-разработчиков, которые создают и тестируют сайты, а также для SEO-специалистов.

При разработке сайтов, а затем при их продвижении нужно тестировать их на наличие так называемых «битых» ссылок, которые могут возникать на сайте со временем. В первую очередь наличие нерабочих ссылок плохо сказывается на впечатлении от сайта для пользователя, а во-вторых, сайты с неработоспособными ссылками ранжируются хуже, то есть располагаются в списке поиска ниже, чем сайты, в которых такие отсутствуют. Поэтому, чтобы проанализировать весь сайт требуется специальное программное обеспечение, так как вручную проделать такую работу не представляется возможным. XENU Link Sleuth именно для этого и предназначена.

Описание программы XENU Link Sleuth

Данное ПО имеет обычный интерфейс, который позволяет просто и надежно «общаться» с программой. Он не предназначен для того, чтобы нести какое-то визуальное удовлетворение от использования, но полностью справляется со своей задачей.

Для того, чтобы вам проверить «битые ссылки» на сайте необходимо перейти в пункт «Проверить URL» в верхнем меню программы XENU Link Sleuth. Затем, откроется модальное окно, в котором в поле «URL» нужно ввести соответствующую ссылку на сайт. Вводить ссылку нужно внимательно, без протокола доступа, то есть без «http://», а только адрес сайта. Здесь же, вам предоставляется возможность проверить не только внутренние, но и внешние ссылки. Для этого необходимо выставить флажок (галочку) в соответствующем поле.

Также, в данном окне присутствует кнопка с дополнительными опциями. Она позволяет вам настраивать процесс сканирования сайта. Например, вы можете установить количество одновременных потоков, которые будет проверять ссылки. Это позволяет увеличить производительность и скорость работы программы. Также, вы можете указать глубину уровней проверки ссылок, и так далее.

После всех настроек нажимаем «ОК» и ждем окончания сканирования. В результате вы получаете список всех ссылок сайта, где зеленым цветом отмечены работоспособные ссылки, а красным – нет. После этого, вам необходимо просмотреть и решить проблему уже вручную или с помощью своего веб-мастера.

Xenu – программа для анализа работы веб-сайта. Помогает обнаружить «битые ссылки», указывает на место их нахождения, приводит ряд рекомендаций по улучшению качества сайта. Используется профессиональными аналитиками, SEO-оптимизаторами для достижения более высокой позиции в поисковых выдачах. Работает как с текстом, так и с графическими объектами, фоновыми изображениями, таблицами, другими компонентами.

Продукт обладает простым интерфейсом, облегчающим ориентирование в программе. Пользователь вводит необходимый адрес, после чего приложение выдает лист ссылок с указанием их состояния. Позволяет компоновать данные в отчеты, создавать графики для более наглядного демонстрирования результатов. Есть возможность экспортировать их в Excel, открывать в браузере. Помогает запустить автоматическую проверку по прошествии определенного периода.

Скачать бесплатно полную русскую версию Xenu с официального сайта без регистрации и смс.

Системные требования

  • Поддерживаемые ОС: Windows XP, Vista, 7, 8.1, 10, 8
  • Разрядность: 32 bit, x86, 64 bit

Выявляем нерабочие ссылки на своем сайте с помощью Xenu Link Sleuth

Выявление нерабочих ссылок на своем сайте с помощью плагинов WordPress может привести к интенсивному использованию серверных ресурсов и в итоге отразиться на производительности сайта. Плагины, такие как Broken Link Checker, на некоторых хостингах ограничены в своем применении, поскольку они создают проблемы с производительностью. К счастью, существуют бесплатные программы, позволяющие разгрузить сервер и перенести процесс проверки ссылок на локальный компьютер. Xenu Link Sleuth – одна из таких программ. Выпущенная в 2010, программа Xenu Link Sleuth совместима с Microsoft Windows 95/98/ME/NT/2000/XP/Vista/7.

После установки программы на свой компьютер введите адрес сайта, который вы хотите проверить. Проверка ссылок выполняется для стандартных ссылок, изображений, фреймов, плагинов, фонов, локальных карт, стилевых таблиц, скриптов и java-апплетов. Программа выводит на экран постоянно обновляющийся список адресов, который вы можете отсортировать по разным критериям. Отчеты могут быть сгенерированы в любое время. Поскольку большая часть обработки производится на компьютере, все происходит гораздо быстрее и не затрагивает базу данных для хранения результатов. Еще одно преимущество программы – в отличие от онлайн-сервисов, вы не ограничены в максимальном количестве ссылок, которые могут быть проверены.

При генерации отчета для сайта WPTavern.com, Xenu проверил более 10 000 ссылок. Зеленый текст говорит о том, что никаких ошибок не произошло, в то время как красный цвет указывает на проблему. В моем случае это обычно означало, что изображение не было найдено. Поскольку отчет может состоять из тысяч ссылок, Xenu Link Sleuth предлагает возможность просмотра только нерабочих ссылок.

Несмотря на то что Xenu Link Sleuth не работает в Mac, программа под названием Integrity доступна для Mac OS X Mavericks. Она была недавно обновлена для поддержки Mavericks и ретина-дисплеев.

Хорошая практика или пустая трата времени?

С помощью Xenu Link Sleuth я нашел сотни неработающих ссылок из тысяч ссылок, находящихся в архивах WPTavern. Я не знаю, нужно ли их исправлять. Битые ссылки – часть естественного жизненного цикла сети. С одной стороны, я хочу, чтобы каждая существующая ссылка на моем домене работала корректно. С другой стороны, я чувствую, что с изменением ссылок я изменю историю. Должен ли я исправлять ссылки только за определенный промежуток времени? Как часто вы проверяете наличие неработающих ссылок на своем сайте? Какие программы или сервисы вы используете для этого?

Источник: wptavern.com

результатов — Документация Xenu’s Link Sleuth

После того, как вы введете URL-адрес для проверки Xenu и нажмете кнопку OK в диалоговом окне «Начальная точка Xenu», в главном окне Xenu появится быстрый список проверяемых ссылок.

Xenu показывает хорошие ссылки в зеленом , неработающие ссылки в красном , исключенные типы ссылок в темно-синем и ссылки, которые еще предстоит проверить, в сером . Когда программа завершит проверку ссылок, она сообщит вам, что «Поиск ссылок завершен», и спросит вас, хотите ли вы отчет.

HTML отчет

Щелкните Да , если вы хотите получить отчет о HTML-странице, в противном случае щелкните Нет . Вы также можете сгенерировать HTML-отчет позже, используя команду Report в меню File .

Формат отчета

Xenu — это HTML-страница, которая откроется в окне браузера по умолчанию, чтобы показать вам корневой URL-адрес, который был проверен, и предоставить следующую сводку для этого URL-адреса (в зависимости от включенных опций):

  • Неработающие ссылки, упорядочены по ссылке
  • Неработающие ссылки, отсортированные по страницам
  • Неработающие локальные ссылки
  • Список перенаправленных URL-адресов (URL-адреса, которые были перемещены)
  • Список URL-адресов ftp и gopher
  • Список действительных URL-адресов, которые можно отправить поисковой системе
  • Карта сайта действительных HTML-страниц с заголовком
  • Орфанные файлы (требуется доступ по FTP для удаленной проверки файлов)
  • Статистика для менеджеров

Отчет не в формате HTML в главном окне Xenu

Вы можете просмотреть подробные результаты в главном окне Xenu.В отчете для каждой ссылки отображается следующая информация:

  • Адрес — Полный URL текущей ссылки.
  • Статус — показывает, является ли ссылка OK , не работает , пропущено и т. Д.
  • Тип — Тип MIME для текущей ссылки.
  • Размер
  • Заголовок — показывает заголовок для извлеченных веб-страниц, текст ссылки для пропущенных URL-адресов.
  • Дата — Дата изменения штампа файла / URL.
  • Уровень — 0 для начальной страницы, 1 для URL-адресов, на которые есть ссылки со стартовых страниц, 2 для URL-адресов, на которые есть ссылки с этих страниц и т. Д., В зависимости от количества уровней, разрешенных в диалоговом окне «Параметры».
  • Исходящие ссылки — количество исходящих ссылок на проверяемой странице.
  • Ссылки в — количество входящих ссылок на проверяемой странице.
  • Server — серверное программное обеспечение для URL-адресов в Интернете (пусто для локальных URL-адресов)
  • Ошибка — описание ошибки.
  • Duration — длительность процесса извлечения.
  • Charset — кодировка символов.

Вы можете отсортировать результаты, щелкнув эти заголовки, что полезно, когда вы хотите быстро получить представление о количестве и типе ошибок, были ли определенные типы ссылок проверены или пропущены и т. Д.

Отфильтровать результаты

В меню Просмотр вы можете переключиться на Показывать только битые ссылки , что поможет вам легче увидеть неработающие ссылки.(Примечание: если вы выбрали этот параметр, но у вас нет неработающих ссылок, в окне ничего не будет отображаться. Отключите его, чтобы увидеть все ссылки, которые были проверены.)

Найдите соответствующую страницу

Щелкните правой кнопкой мыши неработающую ссылку и выберите Свойства , чтобы увидеть, какие страницы вашего сайта содержат ссылку. URL-адреса ссылающихся страниц появятся в нижнем окне под заголовком Страницы, ссылающиеся на этот .

Экспорт в другие форматы

Вы можете легко экспортировать отчет Xenu в несколько других форматов файлов, используя соответствующий Export to… команды в меню Файл . В настоящее время поддерживаются следующие форматы:

  • Файл, разделенный табуляцией (лучше всего для просмотра в Excel и других программах для работы с электронными таблицами)
  • Файл GraphViz (открытый формат для представления структурной информации в виде диаграмм)
  • Файл Google Sitemap (можно отправить в Google и другие поисковые системы для лучшего сканирования вашего сайта)

Найдите неработающие ссылки на вашем сайте с помощью Xenu Link Sleuth (TM)

Найдите неработающие ссылки на вашем сайте с помощью Xenu Link Sleuth (TM)

Программа для поиска битых ссылок на сайтах

Описание

Ксену Link Sleuth (TM) — это программное обеспечение для обнаружения пауков, которое проверяет Веб-сайты на наличие битых ссылок.Проверка ссылок выполняется на «обычных» ссылках, изображения, фреймы, плагины, фоны, локальные карты изображений, таблицы стилей, скрипты и Java-апплеты. Он отображает постоянно обновляемый список URL-адресов. которые можно сортировать по разным критериям. Отчет можно составить в любом время.

Дополнительные возможности:

  • Простой пользовательский интерфейс без излишеств
  • Может перепроверить неработающие ссылки (полезно при временных сетевых ошибках)
  • Простой формат отчета, также можно отправить по электронной почте
  • Исполняемый файл менее 500К
  • Поддерживает SSL-сайты («https: //»)
  • Частичное тестирование ftp и gopher сайтов
  • Обнаруживает перенаправленные URL-адреса и сообщает о них
  • Карта сайта

Скачать

Скачивая, вы подтверждаете что:
  • Вы лично проверите программу на вирусы перед ее запуском (я сделайте то же самое с программным обеспечением, которое я загружаю с помощью Norton AntiVirus)
  • Вы не возлагаете на меня ответственность за ущерб (потерянное время, поломка компьютера, и т. д.)
Системные требования: Microsoft Windows 95/98 / ME / NT / 2000 / XP, WININET.DLL требуется (обычно входит в комплект). Нет, в Windows 3.11 это не сработает, не даже с Win32s. Нет, я не буду делать Java, MacOS, Linux, Beos, Palm или Версия C64. Даже не спрашивайте!

Вниманию пользователей CompuServe: Старая версия RPAWINET.DLL (например, от 18.9.1996), поставляемый с компакт-диском WinCIM 3.0, смертельно опасен — идти получить исправление от CompuServe .

Хорошо, я все это прочитал, хочу Скачать! (текущая версия: 1.2b с ноября 30 числа 2001 г.)

Начало работы:
Распакуйте его и установите где хотите. К проверьте сайт, щелкните значок на панели инструментов слева и введите адрес WWW. Если адрес заканчивается именем каталога, не забудьте поставить / в конце, или вы, возможно, получите весь родительский каталог.

Неправильно:
http://www.host.com/~user

Правильно:
http: // www.host.com/~user/

Вы также можете нажать кнопку «Обзор», чтобы проверить локальный HTML-файл. Если вы еще не используете IE для просмотра и сидите за брандмауэром , не забудьте настроить прокси перед запуском. Чтобы узнать, на что способно программное обеспечение, просто попробуйте варианты меню, панель инструментов и правую клавишу мыши. Или читать этот отличный пользователь руководство Университета Индианы .

Удачи! Если вы сочтете программу полезной, пожалуйста щелкнуть здесь.

Проверить все. Держись за хороший.
(1 Фессалоникийцам 5:21)

Присоединяйтесь к обновлению Список рассылки объявлений в Yahoo Groups! Чтобы подписаться, отправьте пустой электронное письмо по адресу [email protected]
Если вы хотите использовать кнопку на своей странице в Интернете, сделайте ссылку на эту страницу с помощью эта кнопка:

Адрес этой веб-страницы: http://home.snafu.de/tilman/xenulink.html


Часто задаваемые вопросы (FAQ)

1. Кто такой Ксену?

Посмотреть здесь.

Вы хотите быть Рыцарем Ксену ? Тогда присоединяйся эта команда во всем мире расшифровка ключей RC5-64 усилия, которые используют «время простоя» на тысячах компьютеров по всему миру. мир. Вот как это сделать:

  1. Скачайте клиент.
  2. Настроить клиента:
    1. Выберите «1» («Общие параметры клиента»), затем выберите «1» («Ваш адрес электронной почты»). и введите свой адрес электронной почты (без «<" или "("), затем вернитесь к главное меню с «0».
    2. Выберите «2» («Параметры обновления буфера и буфера»), затем выберите «9» («Загрузка-работа приоритет «), затем нажмите клавишу возврата, чтобы удалить все, и введите «RC5, DES = 0, CSC = 0, OGR = 0».
    3. Если вы находитесь за брандмауэром или используете коммутируемую линию, вам нужно будет выбрать «6» («Сервер ключей <=> Параметры подключения клиента») для настройки использования прокси или следить за модемным активным подключением. Вернитесь к главное меню, дважды введя «0».
    4. Введите «0», чтобы сохранить настройки и выйти.
  3. Запустите клиента и посмотрите, как он работает.
Через день или два вы можете перейти к основному страницу статистики и введите свой адрес электронной почты. Затем вы можете получить доступ ваша собственная страница статистики. Прокрутите вниз и нажмите «Пожалуйста, напишите мне мой пароль «. Вы получите электронное письмо с вашим идентификатором и паролем. Теперь нажмите здесь, чтобы присоединиться к команде № 3504 и ввести идентификатор и пароль, когда потребуется.

Пожалуйста, не участвуйте в этом проекте, если вы корпоративный компьютер без предварительного разрешения вашего руководителя и люди из службы безопасности.

Напишите мне если возникнут проблемы. Но сначала прочтите описание выше.

2. Является ли Link Sleuth (TM) Xenu лучше, чем WebAnalyzer?

Да и нет. Xenu’s Link Sleuth (TM) не имеет графические возможности WebAnalyzer 2.0 («Wavefront view»). Но здесь Вот некоторые из преимуществ Xenu’s Link Sleuth (TM):
  • Бесплатно
  • Простой пользовательский интерфейс
  • Более качественные отчеты об ошибках (а не только «сетевая ошибка»)
  • «Сохранить» работает также, пока программа занята
  • «Просмотр неработающих ссылок» показывает только неработающие ссылки; В WebAnalyzer у вас будет нажимать кнопку снова и снова, так как окно заполняется хренью.
  • Хотя Xenu не предлагает возможности «обновления» (которая все равно не работает), у него есть функция «перепроверить битые ссылки», которая отлично работает.
  • Он небольшой, написан одним человеком с 5-летним опытом разработки под Windows. и 15 лет профессионального опыта в качестве разработчика программного обеспечения. Это означает что ошибки будут исправлены быстро. Это вопрос чести.
  • Отчет можно легко просмотреть, даже если у вас длинные URL-адреса.
  • Использует гораздо меньше места на диске для промежуточных файлов, исполняемый файл значительно меньше
  • Загрузка сохраненных файлов намного быстрее (WebAnalyzer теряет время, отображая дополнительная графика)
  • Поддерживает SSL-сайты («https: //»)
  • Частичное тестирование ftp и gopher сайтов
  • Поиск локальных сиротских файлов
  • Специальная обработка перенаправленных URL-адресов
  • Карта сайта
  • Рандомизация порядка проверки означает меньшее количество одновременных запросов на одном сервер
Xenu sez: проверьте свой веб-сайт как с этот продукт и с другим продуктом (Linkbot, InfoLink, LinkScan, LinkAlarm Предлагаем пробные версии — WebAnalyzer больше не доступен с февраля 2002 и не обновлялся годами), и решите, что вам нужно и что вы готовы платить.

3. Является ли Link Sleuth (TM) Xenu лучше, чем Net? Механик?

Много лет назад Net Mechanic был бесплатным сервисом на базе WWW и был полезен для проверить очень маленьких веб-сайтов. Это уже не бесплатно. Бесплатная пробная версия слишком маленький и сообщает обо всех ссылках, а не только о битых.

4. Могу ли я поддержать автора материально?

Не нужно. Если вы считаете, что программное обеспечение полезно, вы можете пожертвовать деньги причины поддерживаю.
  • AFF — некоммерческая организация, освобожденная от налогов. научно-исследовательский центр и образовательная организация, основанная в 1979 году.Миссия AFF заключается в изучении психологических манипуляций и культовых групп, для обучения общественности и профессионалов, а также для оказания помощи тем, кто пострадал благодаря культовому опыту. Предлагаю пожертвовать 20 долларов физическим лицам. и 200 долларов для корпораций. В США ваше пожертвование может быть вычтено из ваш доход. (AFF никоим образом не поддерживает этот сайт, не разрабатывал это программное обеспечение, не продает это программное обеспечение, и использование этого программного обеспечения не зависит от того, делаете вы пожертвование или нет.)
  • Если налоговый вычет не является проблемой, сделайте щедрое пожертвование в пользу иск имения Лизы Макферсон против саентологии. Лиза Макферсон была девушкой, которая умерла «на попечении» саентологической организации. Подробности на http://www.lisamcpherson.org или http://www.lisatrust.net/stories/victors/lisa.htm. То, что случилось с Лизой, даже

  • хуже чем то, что я когда-либо слышал в рассказах о смертях в домах престарелых. Здесь как она ухаживала ее смерть.
    Отправляйте чеки по адресу:
    Фонд защиты имущества Лизы Макферсон
    с / о Адвокатское бюро Дандар и Дандар
    а / я 24597
    Тампа, Флорида 33623
Немцы могут сделать пожертвование Диалогу без вычета налогов Zentrum Berlin e.V., Konto-Nr. 15513, Bank für Kirche und Diakonie BLZ 35060190.

Или посетите книжный магазин Xenu.

5. Почему Xenu Link Sleuth (TM) сообщает о http://www.site.com/../page/index.html как сломано?

Ключ — это «../ «часть. Это означает у вас, например, страница верхнего уровня, которая ссылается на страницу в каталоге выше, которого не существует. Это правда, что у Mozilla проблем не будет. с такой страницей; но я менее терпим.

6. Как настроить прокси?

Вы можете настроить прокси в управляющем приложении Windows. Двойной клик на символе «Интернет», затем щелкните «карточку» диалогового окна, которое называется «Соединение». Вам понадобится прокси, если вы сидите «за спиной» файервол ».Обычно это так в больших корпоративных сетях.

7. Почему Xenu’s Link Sleuth (TM) сообщает об URL с место в нем?

Либо потому, что у вас есть пробел в URL-адресе, либо потому, что у вас есть каретка возврат / новая строка в нем. Хотя Mozilla терпит это, я нет.

8. Я использую Mozilla 3.0 Gold и не могу избавиться от файла: URL-адреса для изображений. Что я могу сделать?

Перередактировать страницу, дважды щелкнуть по картинке, удалить файл: из местоположения изображения и не забудьте снять флажок «копировать изображение в документ местоположение »в диалоговом окне« Свойства »(слева внизу) перед вами сохраните и выйдите из диалогового окна.

9. Какое максимальное количество веб-сайтов можно проверить?

Максимума нет. Он ограничен объемом памяти вашего компьютера.

10. Может ли программа проверять мой сайт локально?

С сентября 1998 г. (1.0n) вы можете делать это без локального веб-сервера (ваш тогда адрес будет http://127.0.0.1). Используйте кнопку «Обзор» в диалоговом окне «Создать».

Результаты не всегда будут такими же, как при «удаленной» проверке:

  • Иногда вы получаете «ошибку 3».Это происходит потому, что WININET.DLL не может для обработки каталогов, то есть ссылок, заканчивающихся на «/». Вы можете избежать этого путем ссылки на фактический «основной файл», обычно index.html или default.html. Ваш браузер может обрабатывать локальные каталоги и красиво их отображать, потому что он выполняет дополнительную работу, , а я этого не делаю.
  • Смешанные символы верхнего и нижнего регистра в ссылках не будут обнаружены, поскольку Windows не имеет значения. Но UNIX делает!
  • Основная причина того, что вам все еще нужно время от времени проводить «удаленные» проверки потому что вы могли забыть загрузить свои файлы на ваш WWW сервер.
Пользователь IE 4.0 сообщил, что, когда он не в сети, программа проверяет все «удаленный» URL как локальный файл. Это проблема более новой версии файла WININET.DLL; версия с IE 3.0 сообщает «нет связи» или вместо этого «нет такого хоста», что более логично.

11. Работает ли на Windows NT 3.51?

Один пользователь сказал, что все работало нормально после того, как он скопировал версию WININET.DLL из систему Windows 95, стоящую рядом, и поместите ее в каталог, где Xenu’s Link Sleuth (TM) был установлен.

12. Как это так чертовски быстро?

Поскольку он использует (возможно запатентовано, см. патенты здесь и тут) метод, известный как с вытесняющей многопоточностью . Это означает, что ПО для проверки ссылок одновременно извлекает несколько веб-страниц; в соревнования используют ту же технику. Изначально максимальное количество потоков установлен на 30, но вы можете настроить его на любое число от 1 до 100. A слишком большое число может привести к сбоям в подключении или тайм-аутам, а это значит, что вам придется перепроверить неработающие ссылки.В то время у меня было модемное соединение, я получил хорошие результаты с 70. Теперь у меня есть соединение DSL, и мне нужно установить число от 1 до 5. Я подозреваю, что у моего провайдера DSL есть где-то установили тормоз, чтобы «коммерческие» клиенты не могли использовать недорогая «частная» услуга.

13. Могу ли я получить исходный код?

Хахахахахаха!

14. Могу ли я купить исходный код?

Конечно, сделайте мне «предложение, от которого я не могу отказаться».

15. Ради интереса я проверил веб-сайт Тилмана и обнаружил много неработающих ссылок.Почему?

Каждую неделю по пятницам я проверяю свой веб-сайт. Тем не менее всегда есть битые ссылки:
  • Ссылки, которые, как я знаю, не работают: я держу их в таком виде, чтобы напомнить мне найти эти люди когда-нибудь. На самой веб-странице есть уведомление о том, что ссылка сломанный.
  • Временные недоступные хосты: это временные ошибки маршрутизации.
  • Действительно неработающие ссылки: я обычно исправляю ссылку или удаляю ее в следующие несколько дней.

16. Как исправить битые ссылки?

Восстановление неработающих ссылок (т.е. получение правильных) — сложная задача. это требует времени, но с опытом вы сделаете это все быстрее и быстрее.
  • если у вас есть адрес электронной почты владельца сайта (потому что вы его знаете), попробуйте электронную почту. Иногда адрес все еще работает, даже если веб-сайт ушел.
  • найдите домашнюю страницу сайта, на который вы ссылаетесь, и проверьте, есть ли на сайте «извините» мы переместили «сообщение».Если вы указали ссылку на http://www.host.com/~user/page888.html и это не работает, посмотрите http://www.host.com/~user/, чтобы увидеть есть ли сообщение, или чтобы узнать, был ли сайт реорганизован. Некоторые сайты реорганизуют свои пользовательские страницы по-другому, например http://www.host.com/homepages/users/page888.html. Иногда Интернет переключается между двумя методами. Другие сайты принадлежат самому пользователю, например www.user.com, так что дом page — это корневая страница. Если сайт существует, но вы не можете найти свою страницу, отправить электронное письмо владельцу.
  • используйте поисковые системы, чтобы найти сайт или имя владельца сайта (если вы знать). Чтобы узнать, где находится сайт, используйте поисковые системы (например, Google). и поисковые системы usenet (например, Google).
    • Вы нашли сайт, который искали
    • Вы найдете сайт, который ссылается на сайт, который вы искали
    • Вы находите сайт в Google Cache (просто введите URL-адрес в Google поле поиска!) и может использовать содержимое для поиска имени владельца
    • Вы находите сайт, который ссылается на сайт, который вы искали, но тоже не работает.Отправьте электронное письмо владельцу сайта и сообщите ему, что ссылка не работает. Добавить в закладки сайт и посетите его через неделю, чтобы узнать, нашел ли его другой человек. Если нет, то тем не менее вам удалось заставить другого человека почувствовать так же плохо, как и вы, что приносит некоторое облегчение 🙂
    • Вы найдете новый адрес электронной почты пользователя. Или напишите ему по электронной почте, или попробуйте самостоятельно создать URL ([email protected] ведет на http://www.host.com/~user/)
  • разместить сообщение в группе новостей, посвященной данной теме.Надеюсь, сообщения там читает владелец сайта или один из его друзей.
  • если у вас все еще не получилось, либо удалите ссылку на сайт, либо повторите ваши попытки через месяц (некоторые сайты могут снова появиться в поисковой системе через некоторое время). Иногда случается, что хост реорганизует свои жесткий диск, и все пользовательские страницы вернутся в течение нескольких дней.

17. А как насчет ftp и gopher-сайтов?

Начиная с версии 1.0k Я реализовал новый метод проверки ftp это на 100% надежно. К сожалению, этот метод не работают с прокси. Предыдущий метод, который я использовал (и все еще использую для gopher) был ненадежным, так как не обнаруживал определенных ошибок.

Метод проверки сусликов все еще ненадежен. Когда ftp или доступ к сайту gopher через прокси, этот прокси создает сеть страница. К сожалению, не всегда появляется информация о том, существует или нет. Когда вы заходите на сайт gopher без прокси, он приносит сообщение об ошибке, но не код ошибки .Кажется, это ошибка функции OpenURL () файла WININET.DLL.

В выводе перечислены ftp и gopher-сайты в виде ссылок, что позволяет сделайте ручную проверку этих сайтов.

18. Почему я не могу запускать URL-адреса?

Начиная с версии 1.0g (Рождество 1997 г.), URL-адреса запускаются с помощью DDE. («динамический обмен данными», оконный метод связи между приложениями), для открытия многих окон браузера, но для предотвращения открытия нескольких Netscape Приложения.Это делается с помощью Реестра, путем поиска для HKEY_CLASSES_ROOT \ http \ shell \ open. Это путь к браузер, имя приложения DDE (например, «Netscape»), тема DDE (обычно «WWW_OpenURL») и шаблон для элемента DDE (обычно «% 1»). Если вы не можете запустить URL, не паникуйте — экспортируйте и отправьте мне сегмент по электронной почте. вашего реестра (запустите REGEDIT.EXE и найдите «http»).

Причина обычно в том, что вы неправильно установили Netscape (возможно, вы только что перенесли файлы с другого компьютера).Решение: переустановить Netscape поверх вашей текущей установки.

Начиная с версии 1.1b, я перестал отображать сообщение об ошибке когда реестр неполный, потому что было слишком много жалоб. Вместо этого браузер просто запустится со страницей. Это недостаток в том, что страница не будет отображаться в дополнительном окне текущее активное приложение браузера.

19. Почему LinkSleuth возится с файлами cookie?

Если вы спросите об этом, значит, вы настроили свою интернет-конфигурацию на быть запрошенным перед отправкой файла cookie и постоянно получать запросы.Но к сожалению Я не несу ответственности за это — это часть WININET.DLL от Microsoft. Согласно Cookie Central, ты мало что можешь сделать.

20. Почему некоторые ссылки отображаются в Xenu как «неработающие», которые могут отображаться? в моем браузере?

Некоторые серверы читают «Пользовательский агент», то есть название программного обеспечения, которое пытается получить доступ к веб-сайту. Некоторые веб-сайты запрограммированы только для Netscape. и Internet Explorer, а от всего остального откажитесь. Некоторые могут даже специально отказать Ксену из-за неправильного использования в прошлом.Настраиваемый пользователем «Пользовательский агент» будет быть решением, но это сделало бы возможным злоупотребление.

21. Почему я не могу подключиться к «безопасным» (https) сайтам?

Если вы правильно настроили прокси, попробуйте подключиться с IE. Если это не сработает, прочтите этот пост usenet для помощи. Если это по-прежнему не работает и вы используете Windows NT 4.0, установите последнюю Пакеты обновлений NT (до SP5).

22. Какие-нибудь известные проблемы с Windows 95?

Некоторые люди сообщали о сбоях.Эти проблемы обычно решались установка IE 3.0 (или выше) или следующих пакетов обновления: У одного человека были проблемы с WININET.DLL (v. 4.70.1300), установленным с OEM Windows 95 (версия 95 4.00.950 C). Переход на версию 4.70.1335 решил эта проблема.

Более простое решение — перейти на http://windowsupdate.microsoft.com и установите все, что они вам скажут (вам нужно иметь IE 4.0 или выше на ваша система)

23. Какие-нибудь известные проблемы с Windows 2000?

Хотя я получил много сообщений о том, что он работает нормально, один пользователь сообщил о проблема и решение:

Windows 2000 автоматически устанавливает параметр конфигурации для использования HTTP 1.1 для подключения к веб-сайтам. Многие, многие веб-сайты не используют эту версию но продолжайте использовать HTTP 1.0, поэтому автоматическая настройка может препятствовать подключению. Это причина, по которой Ксену не побежал за мной. Когда я отключил это настройки, Xenu выполнил должным образом.

Чтобы отключить эту настройку: Панель управления -> Свойства обозревателя -> Дополнительно (вкладка) -> Настройки HTTP 1.1 (заголовок списка) -> Использовать HTTP 1.1 (флажок: снять флажок Это)

24.Почему я не могу настроить тайм-аут?

Потому что я не может … В Microsoft Windows есть ошибка что мешает мне дать пользователям возможность настраивать его.

25. А как насчет JavaScript?

Программа не проверяет ссылки, созданные с помощью JavaScript, потому что JavaScript это язык программирования, а не язык форматирования. Это делает веб-страницы динамический; они например зависеть от движения мыши, сделанного несколько минут назад. Пока это вероятно, будет легко проверить ссылки JS, такие как javascript: newWindow (‘../popup/glossary.html#xenu ‘) проблема в том, что не все ссылки JavaScript сделаны таким образом. Многие авторы предоставить свою собственную функцию newWindow (). Если у вас есть идея легкого решение, электронная почта меня.

26. А как насчет паролей, введенных в ФОРМУ?

Программа не может вводить пароли в ФОРМУ. Я просто не вижу способ легко это сделать. Я предполагаю, что это возможно, если объединить набор имен переменных, значений и веб-страница, которая их примет с помощью команды POST.Я даже не нашел времени, чтобы выяснить, как другие делают это; если у вас есть идея простого решения, напишите меня.

27. Как насчет WAP-версии?

Xenu проверяет файлы .wml с февраля 2001 года.

Список ошибок

Программа работает неплохо, но вот список вещей, которые не должны быть.
  • количество потоков иногда неверно, если максимальное значение изменяется во время активный
  • количество потоков иногда неверно в конце сеанса
  • В закрывающем теге не должно быть пробелов или символов новой строки внутри
  • .
  • <код апплета = "myclass.class "archive =" jump.zip "> создаст битая ссылка, если myclass.class существует, но только в архиве
  • оставшиеся файлы TGH *. * в каталоге% TEMP%
Если вы обнаружите другую ошибку, напишите мне описание, , пожалуйста, включите URL, который вы проверяете, и если можно попробовать сохранить свою работу в файл .XEN и прикрепить его. Также проверьте http://windowsupdate.microsoft.com чтобы убедиться, что в вашей системе есть все обновления.Если вы хотите по электронной почте предложение, нажмите здесь.

Список будущих функций

Что я сделаю в будущем (может быть, когда ад замерзнет!):
  • Типы MIME на основе реестра для локального сканирования
  • Запускать локальные файлы в соответствии с типом файла (ShellExecute)
  • Улучшение статистики
    • Итого
    • Классификация ошибок
  • простое преобразование из Unicode
  • РОБОТЫ.текст поддержка
  • Обнаружение удаленной загрузки изображений (это саботирует geocities)
  • Пользовательские представления в Xenu Window

  • Решение для оставшихся файлов TGH *. * Во временном каталоге
  • Параметры командной строки (собственно, это уже было сделано, для клиента которые согласились уделить время моей разработки двум людям, которых я поддерживаю. Если тебе нужно что-то подобное, напишите мне, цена — пожертвование в размере 300 долларов, которое нужно разделить между двумя людьми, которых я поддерживаю)
  • Имена последних проверенных URL-адресов также в меню файла
  • Дополнительная колонка: затраченное время
  • Серверный Link Sleuthing, т.е.е. для использования в качестве приложения CGI, чтобы Интернет-провайдеры могут предлагать своим пользователям поиск каналов, т. Е. Пользователи могут проверять свои собственные веб-сайты.

  • Если вы интернет-провайдер, который готов предложить это, свяжитесь со мной, чтобы поработать детали.
  • Автоматическое сохранение каждую минуту
  • Правильно работающая функция «Обновление», которая повторно проверяет измененные сайты (сложно, так что я никогда этого не сделаю)
  • Проверка внутренних анкеров, проверка дубликатов анкеров
  • Идеи от Криса:
    • Согласование файлов и объектов, принадлежащих странице, для получения общих цифр. для КБ для каждой страницы и перечислить в порядке убывания (TH: это означает что я должен помнить, что это за тип ссылки.)
    • Как насчет того, чтобы определить, сколько шагов нужно, чтобы перейти на определенную страницу? с домашней страницы и сколько килобайт нужно было загрузить, чтобы можно было добраться туда.

    • [TH: полезно, например, какие шаги должен предпринять пользователь, чтобы перейти на страницу конкретного продукта]
  • Читать RFC
  • Файл справки (как только я получу подсказку)
  • Ваш предложения: напишите мне также, если есть что-то из вышеперечисленного, вы бы хотелось бы иметь, и убедите меня сделать это.Если вы хотите сообщить об ошибке, щелкнуть здесь.

История Сыщика Связи Ксену (TM)

(для коллег-разработчиков программного обеспечения)
В апреле и мае 1997 года мой работодатель направил меня на работу за город, потому что другому отделу нужен был парень с опытом работы в MFC. Итак, с понедельника по в пятницу меня не было, а по вечерам мне было до смерти скучно. Каждые выходные Я был дома и обычно проверял свой веб-сайт на наличие битых ссылок с помощью WebAnalyzer .К сожалению, в программном обеспечении было много ошибок, и их служба поддержки игнорировала мои электронных писем, и я был чертовски зол, потому что потратил довольно много денег на продукт, который того не стоил. Моя работа была также первым контактом с VC ++ 4.2 (раньше я работал только с VC ++ 1.5, потому что наши клиенты есть много 16-битных систем), у которых был простой в использовании доступ в Интернет классы. У меня уже был опыт программирования WINSOCK, но эти классы сэкономит мне много времени на оценку заголовков результатов HTTP и других раздражающих вещи.Вечером после отличной итальянской еды с хорошим кьянти Я взял бумагу с письмом в отеле и написал концепцию проверки ссылок. Через месяц мне потребовалось некоторое время, чтобы установить программу разработки на свой компьютер и начал работать, с помощью этой концепции гостиничного номера. Работа велась по вечерам, но в основном по выходным, когда у меня было больше времени.

Моя философия в области разработки программного обеспечения всегда была «меньше, проще, дешевле », задолго до того, как это осознало НАСА.Потому что, Мне не нужна навороченная (но совершенно бесполезная) графика, как в WebAnalyzer. Просто полученные результаты. И лучше бы они были на 100% правы, иначе мне пришлось бы убить себя 🙂

приложение написано на Visual C ++ и максимально использует классы MFC. по возможности: CDocument, CView, CListView, CObArray, CMapStringToOb, CArchive, CInternetSession, CHttpFile и т. Д. И т. Д. Это сэкономило мне много времени!


Кредиты

Иконки в EXE-файле: Мартин Хант и Пол Кэмпбелл; Значок на веб-странице: Эрик Пламмер; Идея использовать баннеры в отчете: Марк Кросс; Логотип Xenu: Fred C.; Анимированный курсор вулкана: Хуан К. Прадас-Бергнес; Идея и помощь по интеграции SMTP: Марк Финдли; SMTP класс: П.Дж. Ночер; Работа Ксену: Уильям К. Ченовет

Товарные знаки

Xenu, Xenu’s Link Sleuth и Link Sleuth являются используемыми товарными знаками Тилман Хаушерр за программные продукты и услуги. Эти продукты никаким образом не связаны с услугами, лицензированными RTC, CoST, BPI, CSI, и т.п.


Домой | $ cientology | Магия | Mozilla | Тильман | Deutsch | Книжный магазин

tilman @ berlin.snafu.de

Обзор программного обеспечения: Xenu Link Sleuth


Примечание: С момента публикации этого обзора Тилман Хаушерр внес дополнительные поправки в свою программу, и текущая версия (по состоянию на 22 июля 2001 г.) — 1.1f. Внесенные изменения перечислены на его веб-сайте.


Я полагаю, что большинство читателей поймут, что такой сайт, как InformationR.Net требует значительного обслуживания, и основная часть этого обслуживания, помимо редактирования Information Research, должна идти на проверку ссылок в различных информационных ресурсах на сайте.

Когда я только начал разрабатывать эти ресурсы, моя проверка ссылок была бессистемной и использовалась, когда позволяло время, и, особенно для Мирового списка, многое зависело от людей, уведомляющих меня об изменениях. Теперь, однако, этот процесс больше не является случайным, хотя его еще нужно адаптировать, если позволяет время.

Большая разница в том, что я обнаружил Link Sleuth Ксену. Xenu (для краткости) — это программное обеспечение для проверки ссылок на веб-сайтах, разработанное Тилманом Хаушерром и сделавшее свободно доступным со своего веб-сайта. Вы просто загружаете небольшой (206 КБ) zip-файл, распаковываете его и размещаете в любом месте вашей файловой системы: даже в распакованном виде он все равно мал — файл .exe занимает всего 410 КБ.

Когда вы запускаете Xenu , вы получаете очень простое окно, важная часть которого показана на рисунке 1.Как видите, выпадающие меню и кнопки не о чем беспокоиться. Чтобы начать, вы нажимаете «Файл», а затем — «Проверить URL». Появившееся всплывающее окно показано на рисунке 2. Введите URL-адрес, как показано — это может быть расположение файла на жестком диске, а не веб-страница, чтобы вы могли проверить ссылки перед загрузкой новой страницы, а затем нажмите кнопку «Дополнительные параметры» в левом нижнем углу окна. В появившемся окне (рис. 3) вы можете установить уровень, на котором паук должен искать, и чем больше уровней вы установите, тем больше времени займет процесс.Если вы хотите проверить только те ссылки, которые вы ввели на странице (в моем случае), вы установите уровень «1».

Xenu работает очень быстро: страница, показанная на рисунке 2, содержала 67 ссылок и была проверена примерно за 40 секунд, причем на домашнем модеме. Xenus работает быстро, потому что паук просматривает несколько потоков одновременно — как видно из рисунка 3, вы можете установить это число самостоятельно. Я оставил его на 30, что было настройкой по умолчанию, но Хаушер заявляет, что обычно он находит удовлетворительную производительность при значении 70.

Вы также можете определить тип выходных данных: на рисунке 3 я запросил неработающие ссылки, упорядоченные по ссылкам и перенаправленные ссылки — это наиболее полезная пара выходных данных с моей точки зрения. По мере продолжения поиска главный экран постоянно сообщает о состоянии поиска, при этом ссылки меняют цвет, поскольку они обнаруживаются, что они активны (зеленый) или представляют проблемы (красный). На рисунке 4 показан экран вывода для поиска в Wlist4.html. Вывод на экран Xenu также может быть представлен как веб-страница, и я считаю, что это наиболее полезная форма вывода, поскольку вы можете использовать горячие ссылки для перехода на проблемные сайты и с них.

В файле часто задаваемых вопросов

Xenu перечислены его преимущества (с небольшими изменениями):

  • Бесплатно
  • Простой пользовательский интерфейс
  • Улучшенные отчеты об ошибках (а не только «ошибка сети»)
  • «Сохранить» работает также, пока программа занята
  • «Просмотр неработающих ссылок» показывает только неработающие ссылки
  • Хотя Xenu не предлагает возможности «обновления», в нем есть функция «перепроверить битые ссылки», которая отлично работает.
  • Это небольшая книга, написанная одним человеком с 5-летним опытом разработки Windows и 15-летним профессиональным опытом разработки программного обеспечения.Это значит, что ошибки будут исправляться быстро. Это вопрос чести. [Я могу засвидетельствовать это, поскольку с тех пор, как я загрузил их, кажется, в феврале 2001 года, было два обновления. TDW ]
  • Отчет можно легко просмотреть, даже если у вас длинные URL-адреса.
  • Использует гораздо меньше места на диске для промежуточных файлов, исполняемый файл намного меньше
  • Загрузка сохраненных файлов намного быстрее [чем у конкурентов].
  • Поддерживает веб-сайты SSL («https: //»)
  • Частичное тестирование ftp- и gopher-сайтов
  • Специальная обработка перенаправленных URL-адресов
  • Карта сайта
  • Рандомизация порядка проверки означает меньшее количество одновременных запросов на одном сервере

FAQ также указывает на конкурирующее программное обеспечение и услуги, но после просмотра цен на WebAnalyzer2 (419 канадских долларов.95), Linkbot (295,00 долларов США), InfoLink (49,95 долларов США), LinkScan (300,00 долларов США), LinkAlarm (веб-служба, которая проверяет, например, 100 страниц в неделю в течение одного года за 52,00 доллара США), а также для MAC, Тесей (49 долларов США), я решил, что поставщик бесплатной информации должен придерживаться части бесплатного программного обеспечения.

Об этой программе особо нечего сказать: она выполняет очень необходимую работу очень быстро и эффективно, и без нее я бы потерялся. Судя по моим собственным поискам информации, ее нужно использовать большему количеству сайтов: люди забывают, как быстро сайты исчезают, или меняют свой адрес (см. Статью Уоллеса Келера в Information Research).Если вы какое-то время не проверяли свою домашнюю страницу, скачайте Xenu и сделайте это — вы, вероятно, будете удивлены результатом.

Профессор Том Уилсон
9 мая 2001 г.


Как проверить неработающие ссылки на вашем сайте с помощью Xenu Link Sleuth — WP Tavern

Проверка неработающих ссылок с помощью плагинов WordPress может привести к интенсивному использованию ресурсов сервера и снижению производительности сайта. Плагины, такие как Broken Link Checker, ограничены некоторыми веб-хостами из-за проблем с производительностью, которые они могут вызвать на сайте.К счастью, существуют бесплатные программы, которые разгружают процесс проверки ссылок с веб-сервера на локальный компьютер. Xenu Link Sleuth — одна из таких программ. Выпущенный в 2010 году, Xenu Link Sleuth совместим с Microsoft Windows 95/98 / ME / NT / 2000 / XP / Vista / 7.

После установки программы на ваш компьютер введите URL-адрес, который вы хотите проверить. Проверка ссылок выполняется на обычных ссылках, изображениях, фреймах, надстройках, фонах, локальных картах изображений, таблицах стилей, скриптах и ​​Java-апплетах .Он отображает постоянно обновляемый список URL-адресов, который можно сортировать по различным критериям. Отчеты могут быть созданы в любое время. Поскольку большая часть обработки выполняется на машине, выполняющей отчет, она выполняется быстрее и не требует базы данных для хранения результатов. Еще одно преимущество заключается в том, что в отличие от онлайн-сервисов вы не ограничены максимальным количеством проверяемых URL.

Когда я создал отчет для WPTavern.com, Xenu использовал от 29 до 30 потоков и проверил более 10 000 URL.Текст зеленого цвета указывает на отсутствие ошибок, а красный — на проблему. В моем случае это обычно означало, что изображение не было найдено. Поскольку отчет может состоять из тысяч ссылок, Xenu Link Sleuth предоставляет возможность просматривать только неработающие ссылки.

Зеленый — это хорошо. Red Is Bad

Хотя Xenu Link Sleuth изначально не работает на Mac, доступна программа под названием Integrity для Mac OS X Mavericks. Недавно в Integrity добавлена ​​поддержка дисплеев Mavericks и Retina.

Хорошая практика или пустая трата времени?

Используя Xenu Link Sleuth, я смог увидеть сотни неработающих ссылок из тысяч, составляющих архив WPTavern.Я не понимаю, стоит ли мне их исправлять или нет. Нарушение ссылок является частью естественного жизненного цикла Интернета. Часть меня хочет убедиться, что каждая ссылка, существующая в домене, работает правильно. Другая часть считает, что, изменив URL-адрес, я изменил бы историю. Должен ли я заниматься ссылками только до определенного периода времени? Как часто вы проверяете на своем сайте неработающие ссылки? Какие программы или сервисы вы используете для выполнения задачи?

Нравится:

Нравится Загрузка…

Xenu’s Link Sleuth — бесплатный программный пакет для поиска неработающих URL-ссылок

С увеличением количества записей и URL-адресов в Интернете постоянная проверка и проверка URL-адресов веб-сайтов становится важной и потенциально трудоемкой задачей. Однако помощь под рукой.
Существует ряд моделей, которые можно использовать для регулярной проверки действительности URL-адресов веб-сайтов. Один из способов — работать со списком веб-сайтов и проверять каждый по отдельности.Это может быть удобно, если вы управляете одним веб-сайтом, но что, если бы у вас было 200, 500, 1000 или более веб-сайтов, как в случае со многими крупными предприятиями и компаниями из списка Fortune 500? Масштабы задачи начинают осознаваться, особенно потому, что она должна выполняться на регулярной основе, как и другие «хозяйственные» задачи, такие как контроль властей.
За прошедшие годы разработчики программного обеспечения и программисты разработали программное обеспечение для проверки URL-адресов, чтобы максимально автоматизировать эту задачу. Это позволяет сэкономить время на исследование и исправление неработающих ссылок.Один из таких пакетов, более подробно описанный ниже, — это Xenu’s Link Sleuth ™ , который можно бесплатно получить на их веб-сайте.

Что делает Ксену?

Xenu’s Link Sleuth ™ — это программное обеспечение для пауков, которое проверяет веб-сайты на наличие битых ссылок, включая стандартные URL-адреса, изображения, фреймы, плагины, локальные карты изображений, сценарии и Java-апплеты. Список URL-адресов постоянно обновляется, и при необходимости можно установить ряд различных критериев. Программное обеспечение поддерживает веб-сайты SSL (т. Е.е. те, которые начинаются с https: //) и отчеты о перенаправленных URL-адресах.

Xenu Системные требования

Для запуска Xenu’s Link Sleuth ™ вам потребуется Microsoft Windows 95, 98, ME, NT, 2000, XP, Vista или 7. К сожалению, он не будет работать в системе Windows 3.1 или Macintosh и не поддерживается с мобильное приложение на данный момент. Однако мне сказали, что он безупречно работает под Fedora 13, Red Hat 8, Ubuntu и OS X через Wine или WineBottler, а также под Crossover на Mac

.

Приступая к рутине

В Fuze мы ежемесячно проверяем ссылки наших клиентов в рамках нашей постоянной технической стратегии.Мы включаем все, от стандартных URL-адресов до PDF-файлов и изображений, поскольку абсолютно необходимо, чтобы все они отображались правильно. Используя Xenu’s Link Sleuth ™ , мы можем идентифицировать и исправлять любые неработающие ссылки. Мы постоянно находим это программное обеспечение чрезвычайно функциональным в использовании.

Дополнительная информация

Вы можете загрузить текущую версию программного обеспечения 1.1f с домашней страницы Xenu’s Link Sleuth ™ по адресу http://home.snafu.de/tilman/xenulink.html.

Xenu: обзор инструментов, функции, цены и возможности интеграции

Неработающие ссылки могут повлиять на рейтинг вашего сайта в поисковых системах и нанести ущерб его репутации в Интернете.Но веб-инструмент с названием прямо из научной фантастики может помочь владельцам сайтов в любой отрасли находить плохие ссылки, выявлять перенаправленные URL-адреса и многое другое, причем совершенно бесплатно.

Названный в честь Ксену, галактического правителя в мифах Саентологии Л. Рона Хаббарда, Xenu Link Sleuth представляет собой приложение для проверки ссылок, которое может проверять до 100 ссылок в минуту на всех страницах любого веб-сайта. Поскольку Xenu Link Sleuth определяет проблемы, мешающие работе пользователей и рейтингу SEO, он может играть важную роль в общей стратегии SEO любой компании.

Зачем беспокоиться о неработающих ссылках?

Гиперссылки, или просто ссылки, представляют собой соединительную ткань Интернета — сеть уникальных URL-адресов, которые обеспечивают обмен данными между веб-сайтами всех типов. Но когда ссылка не работает, она указывает на пустую страницу или несуществующий сайт. Это полностью закрывает путь пользователя к необходимой информации и влияет на обратные ссылки — ключ к повышению авторитета веб-сайта. Хотя случайные неработающие ссылки не обязательно вредны, сайт с несколькими неработающими ссылками создает неудобства для пользователей и отрицательно влияет на его поисковый рейтинг.

Но битые ссылки — улица с двусторонним движением. Некоторые из них вызваны ошибками на исходном сайте, а другие возникают из-за проблем с конечным сайтом. Ввод неправильного или ошибочного URL-адреса, конечно же, приведет к созданию неработающей ссылки, поскольку нет сайта или страницы, соответствующей ей. Таким образом, мы вводим URL-адрес, не проверяя, активна ли ссылка.

В других случаях, однако, неработающие ссылки возникают из-за обстоятельств со стороны целевого сайта. Этот сайт мог быть закрыт или перешел на новый URL.Связанный контент мог быть удален или повторно размещен под другим URL-адресом. В некоторых случаях целевой сайт устанавливает брандмауэр, который предотвращает доступ к контенту, за исключением определенных условий, таких как подписка.

Независимо от того, откуда берутся неработающие ссылки, владелец сайта обязан найти и исправить или удалить их, чтобы поисковые роботы не сталкивались с кодами ошибки 404 «страница не найдена» или множественными переадресациями. Но поиск и исправление этих ссылок вручную может занять много времени, а некоторые проблемные ссылки можно упустить.Вот почему инструмент для очистки веб-страниц, такой как Xenu, может быть полезен для обеспечения удобства поиска на веб-сайте и обеспечения его доступности для пользователей.

Как работает Xenu Link Sleuth?

Основная функция Xenu Link Sleuth — сканировать ваш сайт на предмет неработающих ссылок, но его основные инструменты имеют ряд других функций, которые могут быть полезны для отслеживания рейтинга в поиске и повышения удобства использования веб-сайта.

Стоимость

Xenu Link Sleuth был создан еще в 2010 году как бесплатный веб-скребок для поиска и исправления неработающих ссылок.Сегодня, после более чем 245 000 загрузок, он также предоставляет владельцам сайтов инструменты для проверки производительности сайтов конкурентов, быстрого просмотра конфигурации всего веб-сайта и других функций, связанных с поисковой оптимизацией. Xenu постоянно бесплатен и может быть загружен и установлен на любой компьютер под управлением Windows. На данный момент Xenu недоступен для пользователей Mac.

Простота использования

Xenu поддерживает сайты FTP и SSL, и он может даже сканировать файлы HTML на компьютере пользователя, прежде чем они будут загружены на веб-сайт.Он имеет чистый, четко обозначенный интерфейс, которым легко пользоваться даже тем, у кого нет навыков разработки или программирования.

Чтобы запустить проверку ссылок, просто выберите «Файл» в раскрывающемся меню приложения и введите URL-адрес для проверки. Оттуда вы также можете установить количество уровней, которые должен ползать паук Ксену. Xenu сканирует ссылки, связанные с любым типом контента, включая изображения, фоны, плагины и скрипты.

Xenu возвращает длинный отчет, доступный в различных форматах, обо всех ссылках, имеющихся на сайте, а также обо всех страницах с неработающими переадресациями.Нажав на любую из перечисленных ссылок, вы можете увидеть страницу, связанную со ссылкой, или любые коды ошибок, возвращенные по неработающей ссылке.

Xenu делает больше, чем просто проверяет ссылки

Помимо основной функции проверки ссылок, ключевые функции Xenu можно использовать и другими способами для получения информации, которая может помочь улучшить SEO и рейтинг сайта.

Сортировка ссылок по размеру

Изображения могут улучшить внешний вид веб-сайта, но они могут поступать в виде больших файлов, что увеличивает время загрузки сайта и снижает его производительность.Xenu может сортировать все ссылки по размеру, поэтому вы можете находить большие файлы изображений и оптимизировать их для повышения производительности. Функции сортировки Xenu также позволяют фильтровать поиск по типу файла, например Javascript или приложениям, и находить недостающие элементы, такие как текст изображения ALT.

Анализ ссылок конкурентов

Xenu сканирует ссылки любого URL-адреса, введенного в его интерфейс, поэтому он может показать неработающие и работающие ссылки любого сайта в Интернете. Используя таким образом функцию общего сканирования Xenu, владельцы сайтов могут видеть структуру ссылок на сайтах конкурентов и получать представление об их стратегиях SEO и эффективности.

Анализ информационной архитектуры веб-сайта

Xenu также может предоставить изображение всей структуры URL любого сайта. Наряду со списком ссылок на все элементы сайта, он может показать, сколько кликов необходимо, чтобы перейти с одной страницы на другую, например, с домашней страницы на внутреннюю страницу. Эта информация может показать, является ли архитектура сайта слишком сложной для удобства пользователей и работают ли определенные страницы для общих целей сайта.

Link Sleuth

Xenu предлагает неограниченную проверку ссылок и может сканировать до 100 страниц за одну операцию.Xenu может работать с любой стратегией SEO для улучшения производительности, рейтинга и удобства работы веб-сайта, включая комплексные решения для контент-маркетинга Scripted.

Scripted и Xenu: партнеры по поисковым решениям

Качественный, оптимизированный для SEO контент — краеугольный камень успешной маркетинговой стратегии. Комплексные SEO-решения Scripted сосредоточены на предоставлении этого контента, созданного группой квалифицированных писателей с опытом работы во всех отраслях.

Планы подписки

Scripted предлагают ряд услуг и поддержку для разработки полнофункциональных стратегий SEO, отвечающих вашим уникальным маркетинговым целям.Управляемые планы Scripted также включают периодические проверки сайта, которые включают в себя идеи и информацию из инструментов проверки ссылок Xenu как часть общей стратегии, ориентированной на контент, для повышения видимости вашего сайта.

Каждый из трех планов подписки Scripted включает доступ к обширному кругу профессиональных фрилансеров, умеющих писать сообщения в блогах, официальные документы, сообщения в социальных сетях и другие типы контента для поддержки успешной кампании контент-маркетинга. Ищете ли вы основы для дополнения текущего маркетингового плана или полностью управляемое решение, которое обрабатывает все аспекты вашей стратегии SEO, у Scripted есть план для вас.

Выберите план по сценарию

План Self Serve Basic компании

Scripted предлагает доступ к неограниченному контенту от базового пула квалифицированных авторов контента, оптимизированного с учетом передовых методов SEO и готового для включения в существующие стратегии SEO и маркетинга вашей компании.

Как и Self Serve Basic, план Self Serve Premium включает неограниченное количество контента. Но Self Serve Premium также предоставляет доступ к другому набору писателей — создателям контента с самым высоким рейтингом в пуле писателей Scripted Premium.Этот план включает специального представителя учетной записи, который обеспечивает поддержку для управления вашим планом и работы с авторами, которых вы выбираете из пула Премиум. Self Serve Premium также поддерживает эффективность SEO вашего сайта с помощью первоначального анализа сайта и ежеквартального обзора общего состояния SEO вашего сайта на протяжении всего срока действия вашего плана.

План Cruise Control высшего уровня компании

Scripted — это полностью управляемое решение для SEO, основанное на высококачественном контенте. В Cruise Control мы занимаемся всеми аспектами оптимизации вашего сайта, от поиска лучших писателей в вашей отрасли до регулярных проверок SEO на вашем сайте.План круиз-контроля также включает поддержку специального менеджера по работе с клиентами, который координирует все аспекты вашей индивидуальной стратегии SEO и помогает вам работать с выбранными вами авторами для создания лучшего контента для ваших маркетинговых целей.

Scripted также предлагает специализированные решения, предназначенные для крупных предприятий и агентств цифрового и креативного маркетинга. С Scripted for Agencies ваша компания может распределять свой контент-бюджет по нескольким кампаниям, ориентированным на широкий круг клиентов.У вас будет доступ к специальному менеджеру аккаунта, который позаботится обо всех ваших потребностях в контенте, и вы будете платить только за тот контент, который вам нужен, с неограниченным количеством пользователей и без членских взносов.

Scripted for Enterprise обслуживает крупные предприятия с помощью маркетингового решения «под ключ». Благодаря плану без членства, который включает неограниченное количество организаций и пользователей, Scripted for Enterprise предлагает специальную команду опытных писателей в вашей отрасли, которые могут работать с вами для создания хорошо изученного премиального контента.

Хотите узнать больше о контент-ориентированных и оптимизированных для SEO маркетинговых решениях Scripted для предприятий и отраслей всех видов? Свяжитесь с нами сегодня для консультации или демонстрации.

Найдите неработающие ссылки на вашем сайте с помощью Xenu Link Sleuth (TM)

Найдите неработающие ссылки на вашем сайте с помощью Xenu Link Sleuth (TM)

Программа для поиска битых ссылок на сайтах

Описание

Ксену Link Sleuth (TM) — это программное обеспечение для обнаружения пауков, которое проверяет Веб-сайты на наличие битых ссылок.Проверка ссылок выполняется на «обычных» ссылках, изображения, фреймы, плагины, фоны, локальные карты изображений, таблицы стилей, скрипты и Java-апплеты. Он отображает постоянно обновляемый список URL-адресов. которые можно сортировать по разным критериям. Отчет можно составить в любом время.

Дополнительные возможности:

  • Простой пользовательский интерфейс без излишеств
  • Может перепроверить неработающие ссылки (полезно при временных сетевых ошибках)
  • Простой формат отчета, также можно отправить по электронной почте
  • Исполняемый файл менее 500К
  • Поддерживает SSL-сайты («https: //»)
  • Частичное тестирование ftp и gopher сайтов
  • Обнаруживает перенаправленные URL-адреса и сообщает о них
  • Карта сайта

Скачать

Скачивая, вы подтверждаете что:
  • Вы лично проверите программу на вирусы перед ее запуском (я сделайте то же самое с программным обеспечением, которое я загружаю с помощью Norton AntiVirus)
  • Вы не возлагаете на меня ответственность за ущерб (потерянное время, поломка компьютера, и т. д.)
Системные требования: Microsoft Windows 95/98 / ME / NT / 2000 / XP, WININET.DLL требуется (обычно входит в комплект). Нет, в Windows 3.11 это не сработает, не даже с Win32s. Нет, я не буду делать Java, MacOS, Linux, Beos, Palm или Версия C64. Даже не спрашивайте!

Вниманию пользователей CompuServe: Старая версия RPAWINET.DLL (например, от 18.9.1996), поставляемый с компакт-диском WinCIM 3.0, смертельно опасен — идти получить исправление от CompuServe .

Хорошо, я все это прочитал, хочу Скачать! (текущая версия: 1.2а от 29 сентября 2001 г.)

Начало работы:
Распакуйте его и установите где хотите. К проверьте сайт, щелкните значок на панели инструментов слева и введите адрес WWW. Если адрес заканчивается именем каталога, не забудьте поставить / в конце, или вы, возможно, получите весь родительский каталог.

Неправильно:
http://www.host.com/~user

Правильно:
http: // www.host.com/~user/

Вы также можете нажать кнопку «Обзор», чтобы проверить локальный HTML-файл. Если вы еще не используете IE для просмотра и сидите за брандмауэром , не забудьте настроить прокси перед запуском. Чтобы узнать, на что способно программное обеспечение, просто попробуйте варианты меню, панель инструментов и правую клавишу мыши. Или читать этот отличный пользователь руководство Университета Индианы .

Удачи! Если вы сочтете программу полезной, пожалуйста щелкнуть здесь.

Присоединяйтесь к обновлению Список рассылки объявлений в Yahoo Groups! Чтобы подписаться, отправьте пустой электронное письмо по адресу [email protected]
Если вы хотите использовать кнопку на своей странице в Интернете, сделайте ссылку на эту страницу с помощью эта кнопка:

Адрес этой веб-страницы: http://home.snafu.de/tilman/xenulink.html


Часто задаваемые вопросы (FAQ)

1. Кто такой Ксену?

Посмотреть здесь.

Вы хотите быть Рыцарем Ксену ? Тогда присоединяйтесь к их команде в по всему миру RC5-64 усилия по расшифровке. Присоединиться к команде # 3504 после того, как ваш клиент дешифрования успешно работал для когда-нибудь. (Внимание: не забудьте настроить клиента под свой адрес электронной почты и удалите из него все «(» или «<"). Напишите мне, если вы возникли проблемы с установкой клиента или его настройкой.

2. Является ли Link Sleuth (TM) Xenu лучше, чем WebAnalyzer?

Да и нет.Xenu’s Link Sleuth (TM) не имеет графические возможности WebAnalyzer 2.0 («Вид волнового фронта»). Но вот некоторые из преимуществ Xenu’s Ссылка Сыщик (TM):
  • Бесплатно
  • Простой пользовательский интерфейс
  • Более качественные отчеты об ошибках (а не только «сетевая ошибка»)
  • «Сохранить» работает также, пока программа занята
  • «Просмотр неработающих ссылок» показывает только неработающие ссылки; В WebAnalyzer у вас будет нажимать кнопку снова и снова, так как окно заполняется хренью.
  • Хотя Xenu не предлагает возможности «обновления» (которая все равно не работает), у него есть функция «перепроверить битые ссылки», которая отлично работает.
  • Он небольшой, написан одним человеком с 5-летним опытом разработки под Windows. и 15 лет профессионального опыта в качестве разработчика программного обеспечения. Это означает что ошибки будут исправлены быстро. Это вопрос чести.
  • Отчет можно легко просмотреть, даже если у вас длинные URL-адреса.
  • Использует гораздо меньше места на диске для промежуточных файлов, исполняемый файл значительно меньше
  • Загрузка сохраненных файлов намного быстрее (WebAnalyzer теряет время, отображая дополнительная графика)
  • Поддерживает SSL-сайты («https: //»)
  • Частичное тестирование ftp и gopher сайтов
  • Специальная обработка перенаправленных URL-адресов
  • Карта сайта
  • Рандомизация порядка проверки означает меньшее количество одновременных запросов на одном сервер
Xenu sez: проверьте свой веб-сайт как с этот продукт и с другим продуктом (WebAnalyzer, Linkbot, InfoLink, LinkScan, LinkAlarm и Тесей предлагают испытание версий) и решите, что вам нужно и за что вы готовы платить.

3. Является ли Link Sleuth (TM) Xenu лучше, чем Net? Механик?

Да и нет. ИМО, Net Mechanic (бесплатный сервис на базе WWW) лучше всего проверить очень маленькие веб-сайтов, но бесполезные для остальных:
  • он проверяет 800 ссылок и максимум 20 страниц (май 1999 г.). На моем веб-сайте больше 3000 ссылок.
  • отчет дерьмовый: он сообщает статус всех ссылок , вместо этого из битых штук
  • он не может проверять перенаправления
  • он не может проверять локальные закладки (если вы не загрузите их на свой сайт)
Преимущество Net Mechanic в том, что вы не тратите впустую пропускную способность — вы отправляете свой сайт, а позже получите электронное письмо с указанием на WWW-страницу с результатами.

4. Могу ли я поддержать автора материально?

Не нужно. Если вы считаете, что программное обеспечение полезно, вы можете пожертвовать деньги причины поддерживаю.
  • AFF — некоммерческая организация, освобожденная от налогов. научно-исследовательский центр и образовательная организация, основанная в 1979 году. Миссия AFF заключается в изучении психологических манипуляций и культовых групп, для обучения общественности и профессионалов, а также для оказания помощи тем, кто пострадал благодаря культовому опыту. Предлагаю пожертвовать 20 долларов физическим лицам. и 200 долларов для корпораций.В США ваше пожертвование может быть вычтено из ваш доход. (AFF никоим образом не поддерживает этот сайт, не разрабатывал это программное обеспечение, не продает это программное обеспечение, и использование этого программного обеспечения не зависит от того, делаете вы пожертвование или нет.)
  • Если налоговый вычет не является проблемой, сделайте щедрое пожертвование в пользу иск имения Лизы Макферсон против саентологии. Лиза Макферсон была девушкой, которая умерла «на попечении» саентологической организации.Подробности на http://www.lisamcpherson.org или http://www.lisatrust.net/aboutlisa.htm. То, что случилось с Лизой, даже

  • хуже чем то, что я когда-либо слышал в рассказах о смертях в домах престарелых. Здесь как она ухаживала ее смерть.
    Отправляйте чеки по адресу:
    Фонд защиты имущества Лизы Макферсон
    с / о Адвокатское бюро Дандар и Дандар
    а / я 24597
    Тампа, Флорида 33623
Немцы могут сделать пожертвование Диалогу без вычета налогов Zentrum Berlin e.V., Konto-Nr. 15513, Bank für Kirche und Diakonie BLZ 35060190.

Или посетите книжный магазин Xenu.

5. Почему Xenu Link Sleuth (TM) сообщает о http://www.site.com/../page/index.html как сломано?

Ключ — часть «../». Это означает у вас, например, страница верхнего уровня, которая ссылается на страницу в каталоге выше, которого не существует. Это правда, что у Mozilla проблем не будет. с такой страницей; но я менее терпим.

6.Как мне настроить прокси?

Вы можете настроить прокси в управляющем приложении Windows. Двойной клик на символе «Интернет», затем щелкните «карточку» диалогового окна, которое называется «Соединение». Вам понадобится прокси, если вы сидите «за спиной» межсетевой экран ». Это обычно так в больших корпоративных сетях.

7. Почему Xenu’s Link Sleuth (TM) сообщает об URL с место в нем?

Либо потому, что у вас есть пробел в URL-адресе, либо потому, что у вас есть каретка возврат / новая строка в нем.Хотя Mozilla терпит это, я нет.

8. Я использую Mozilla 3.0 Gold и не могу избавиться от файла: URL-адреса для изображений. Что я могу сделать?

Перередактировать страницу, дважды щелкнуть по картинке, удалить файл: из местоположения изображения и не забудьте снять флажок «копировать изображение в документ местоположение »в диалоговом окне« Свойства »(слева внизу) перед вами сохраните и выйдите из диалогового окна.

9. Какое максимальное количество веб-сайтов можно проверить?

Максимума нет.Он ограничен объемом памяти вашего компьютера.

10. Может ли программа проверять мой сайт локально?

С сентября 1998 г. (1.0n) вы можете делать это без локального веб-сервера (ваш тогда адрес будет http://127.0.0.1). Используйте кнопку «Обзор» в диалоговом окне «Создать».

Результаты не всегда будут такими же, как при «удаленной» проверке:

  • Иногда вы получаете «ошибку 3». Это происходит потому, что WININET.DLL не может для обработки каталогов, т.е.е. ссылки, заканчивающиеся на «/». Вы можете избежать этого путем ссылки на фактический «основной файл», обычно index.html или default.html. Ваш браузер может обрабатывать локальные каталоги и красиво их отображать, потому что он выполняет дополнительную работу, , а я этого не делаю.
  • Смешанные символы верхнего и нижнего регистра в ссылках не будут обнаружены, поскольку Windows не имеет значения. Но UNIX делает!
  • Основная причина того, что вам все еще нужно время от времени проводить «удаленные» проверки потому что вы могли забыть загрузить свои файлы на ваш WWW сервер.
Пользователь IE 4.0 сообщил, что, когда он не в сети, программа проверяет все «удаленный» URL как локальный файл. Это проблема более новой версии файла WININET.DLL; версия с IE 3.0 сообщает «нет связи» или вместо этого «нет такого хоста», что более логично.

11. Работает ли на Windows NT 3.51?

Один пользователь сказал, что все работало нормально после того, как он скопировал версию WININET.DLL из систему Windows 95, стоящую рядом, и поместите ее в каталог, где Xenu’s Link Sleuth (TM) был установлен.

12. Как это так чертовски быстро?

Поскольку он использует (возможно запатентовано, см. патенты здесь и тут) метод, известный как с вытесняющей многопоточностью . Это означает, что ПО для проверки ссылок одновременно извлекает несколько веб-страниц; в соревнования используют ту же технику. Изначально максимальное количество потоков установлен на 30, но вы можете настроить его на любое число от 1 до 100. A слишком большое число может привести к сбоям в подключении или тайм-аутам, а это значит, что вам придется перепроверить неработающие ссылки.В то время у меня было модемное соединение, я получил хорошие результаты с 70. Теперь у меня есть соединение DSL, и мне нужно установить число от 1 до 5. Я подозреваю, что у моего провайдера DSL есть где-то установили тормоз, чтобы «коммерческие» клиенты не могли использовать недорогая «частная» услуга.

Первоначальные тесты показывают, что моя программа работает быстрее, чем WebAnalyzer 2.0. Это также может быть связано с тем, что WebAnalyzer тратит время зря. отображая больше графики.

13.Могу ли я получить исходный код?

Хахахахахаха!

14. Могу ли я купить исходный код?

Конечно, сделайте мне «предложение, от которого я не могу отказаться».

15. Ради интереса я проверил веб-сайт Тилмана и обнаружил много неработающих ссылок. Почему?

Каждую неделю по пятницам я проверяю свой веб-сайт. Тем не менее всегда есть битые ссылки:
  • Ссылки, которые, как я знаю, не работают: я держу их в таком виде, чтобы напомнить мне найти эти люди когда-нибудь. На самой веб-странице есть уведомление о том, что ссылка сломанный.
  • Временные недоступные хосты: это временные ошибки маршрутизации.
  • Действительно неработающие ссылки: я обычно исправляю ссылку или удаляю ее в следующие несколько дней.

16. Как исправить битые ссылки?

Восстановление неработающих ссылок (т.е. получение правильных) — сложная задача. это требует времени, но с опытом вы сделаете это все быстрее и быстрее.
  • если у вас есть адрес электронной почты владельца сайта (потому что вы его знаете), попробуйте электронную почту.Иногда адрес все еще работает, даже если веб-сайт ушел.
  • найдите домашнюю страницу сайта, на который вы ссылаетесь, и проверьте, есть ли на сайте «извините» мы переместили «сообщение. Если вы указали ссылку на http://www.host.com/~user/page888.html и это не работает, посмотрите http://www.host.com/~user/, чтобы увидеть есть ли сообщение, или чтобы узнать, был ли сайт реорганизован. Некоторые сайты реорганизуют свои пользовательские страницы по-другому, например http://www.host.com/homepages/users/page888.html. Иногда Интернет переключается между двумя методами. Другие сайты принадлежат самому пользователю, например www.user.com, так что дом page — это корневая страница. Если сайт существует, но вы не можете найти свою страницу, отправить электронное письмо владельцу.
  • используйте поисковые системы, чтобы найти сайт или имя владельца сайта (если вы знать). Чтобы узнать, где находится сайт, используйте поисковые системы (например, Google). и поисковые системы usenet (например, Google).
    • Вы нашли сайт, который искали
    • Вы найдете сайт, который ссылается на сайт, который вы искали
    • Вы находите сайт, который ссылается на сайт, который вы искали, но тоже не работает.Отправьте электронное письмо владельцу сайта и сообщите ему, что ссылка не работает. Добавить в закладки сайт и посетите его через неделю, чтобы узнать, нашел ли его другой человек. Если нет, то тем не менее вам удалось заставить другого человека почувствовать так же плохо, как и вы, что приносит некоторое облегчение 🙂
    • Вы найдете новый адрес электронной почты пользователя. Или напишите ему по электронной почте, или попробуйте самостоятельно создать URL ([email protected] ведет на http://www.host.com/~user/)
  • разместить сообщение в группе новостей, посвященной данной теме.Надеюсь, сообщения там читает владелец сайта или один из его друзей.
  • если у вас все еще не получилось, либо удалите ссылку на сайт, либо повторите ваши попытки через месяц (некоторые сайты могут снова появиться в поисковой системе через некоторое время). Иногда случается, что хост реорганизует свои жесткий диск, и все пользовательские страницы вернутся в течение нескольких дней.

17. А как насчет ftp и gopher-сайтов?

Начиная с версии 1.0k Я реализовал новый метод проверки ftp это на 100% надежно. К сожалению, этот метод не работают с прокси. Предыдущий метод, который я использовал (и все еще использую для gopher) был ненадежным, так как не обнаруживал определенных ошибок.

Метод проверки сусликов все еще ненадежен. Когда ftp или доступ к сайту gopher через прокси, этот прокси создает сеть страница. К сожалению, не всегда появляется информация о том, существует или нет. Когда вы заходите на сайт gopher без прокси, он приносит сообщение об ошибке, но не код ошибки .Кажется, это ошибка функции OpenURL () файла WININET.DLL.

В выводе перечислены ftp и gopher-сайты в виде ссылок, что позволяет сделайте ручную проверку этих сайтов.

18. Почему я не могу запускать URL-адреса?

Начиная с версии 1.0g (Рождество 1997 г.), URL-адреса запускаются с помощью DDE. («динамический обмен данными», оконный метод связи между приложениями), для открытия многих окон браузера, но для предотвращения открытия нескольких Netscape Приложения.Это делается с помощью Реестра, путем поиска для HKEY_CLASSES_ROOT \ http \ shell \ open. Это путь к браузер, имя приложения DDE (например, «Netscape»), тема DDE (обычно «WWW_OpenURL») и шаблон для элемента DDE (обычно «% 1»). Если вы не можете запустить URL, не паникуйте — экспортируйте и отправьте мне сегмент по электронной почте. вашего реестра (запустите REGEDIT.EXE и найдите «http»).

Причина обычно в том, что вы неправильно установили Netscape (возможно, вы только что перенесли файлы с другого компьютера).Решение: переустановить Netscape поверх вашей текущей установки.

Начиная с версии 1.1b, я перестал отображать сообщение об ошибке когда реестр неполный, потому что было слишком много жалоб. Вместо этого браузер просто запустится со страницей. Это недостаток в том, что страница не будет отображаться в дополнительном окне текущее активное приложение браузера.

19. Почему LinkSleuth возится с файлами cookie?

Если вы спросите об этом, значит, вы настроили свою интернет-конфигурацию на быть запрошенным перед отправкой файла cookie и постоянно получать запросы.Но к сожалению Я не несу ответственности за это — это часть WININET.DLL от Microsoft. Согласно Cookie Central, ты мало что можешь сделать.

20. Почему я не могу проверить ссылки в базе данных фильмов в Интернете?

С августа 1998 года база данных фильмов в Интернете не позволяет программе проверка на их сайте. Судя по всему, кто-то неправильно использовал мое программное обеспечение, которое создают огромную нагрузку на их сервер. Мне было бы легко обмануть механизм защиты, но это также будет означать, что ни один веб-сайт не сможет Защитить себя; Я хочу быть хорошим пользователем сети и не хочу делать Людям слишком легко злоупотреблять моим программным обеспечением.

21. Почему я не могу подключиться к «безопасным» (https) сайтам?

Если вы правильно настроили прокси, попробуйте подключиться с IE. Если это не сработает, прочтите этот пост usenet для помощи. Если это по-прежнему не работает и вы используете Windows NT 4.0, установите последнюю Пакеты обновлений NT (до SP5).

22. Почему вы не включаете поиск потерянных файлов?

«Сиротские файлы» — это файлы, которые вообще не связаны. Я не могу этого сделать, потому что не всегда можно получить доступ к каталогу, обычно по соображениям безопасности, чтобы люди не знали, какие файлы на самом деле доступны.Даже если я реализовал бы такой поиск на локальном диске, это было бы бесполезно для удаленный сервер.

23. Какие-нибудь известные проблемы с Windows 95?

Некоторые люди сообщали о сбоях. Эти проблемы обычно решались установка IE 3.0 (или выше) или следующих пакетов обновления: У одного человека были проблемы с WININET.DLL (v. 4.70.1300), установленным с OEM Windows 95 (версия 95 4.00.950 C). Переход на версию 4.70.1335 решил эта проблема; он сказал, что нашел его на ftpsearch.lycos.com

Более простое решение — перейти на http://windowsupdate.microsoft.com и установите все, что они вам скажут (вам нужно иметь IE 4.0 или выше на ваша система)

24. Какие-нибудь известные проблемы с Windows 2000?

Хотя я получил много сообщений о том, что он работает нормально, один пользователь сообщил о проблема и решение:

Windows 2000 автоматически устанавливает параметр конфигурации для использования HTTP 1.1. для подключения к веб-сайтам. Многие, многие веб-сайты не используют эту версию но продолжайте использовать HTTP 1.0, поэтому автоматическая настройка может препятствовать подключению. Это причина, по которой Ксену не побежал за мной. Когда я отключил это настройки, Xenu выполнил должным образом.

Чтобы отключить эту настройку: Панель управления -> Свойства обозревателя -> Дополнительно (вкладка) -> Настройки HTTP 1.1 (заголовок списка) -> Использовать HTTP 1.1 (флажок: снять флажок Это)

25. Почему я не могу настроить тайм-аут?

Потому что я не может … В Microsoft Windows есть ошибка что мешает мне дать пользователям возможность настраивать его.

26. А как насчет JavaScript?

Программа не проверяет ссылки, созданные с помощью JavaScript, потому что JavaScript это язык программирования, а не язык форматирования. Это делает веб-страницы динамический; они например зависеть от движения мыши, сделанного несколько минут назад. Пока это вероятно, будет легко проверить ссылки JS, такие как javascript: newWindow (‘../ popup / glossary.html # xenu’) проблема в том, что не все ссылки JavaScript сделаны таким образом. Многие авторы предоставить свою собственную функцию newWindow ().Если у вас есть идея легкого решение, электронная почта меня.

27. Как насчет паролей, введенных в ФОРМУ?

Программа не может вводить пароли в ФОРМУ. Я просто не вижу способ легко это сделать. Я предполагаю, что это возможно, если объединить набор имен переменных, значений и веб-страница, которая их примет с помощью команды POST. Я даже не нашел времени, чтобы выяснить, как другие делают это; если у вас есть идея простого решения, напишите меня.

28. Как насчет WAP-версии?

Это доступно с февраля 2001 года; это в настоящее время доступно как бета-версия в файле область LinkSleuthUpdates список рассылки в Yahoo Groups.

Список ошибок

Программа работает неплохо, но вот список вещей, которые не должны быть.
  • количество потоков иногда неверно, если максимальное значение изменяется во время активный
  • количество потоков иногда неверно в конце сеанса
  • В закрывающем теге не должно быть пробелов или символов новой строки внутри
  • .
  • <код апплета = "myclass.class "archive =" jump.zip "> создаст битая ссылка, если myclass.class существует, но только в архиве
  • оставшиеся файлы TGH *. * в каталоге% TEMP%
Если вы обнаружите другую ошибку, напишите мне описание, , пожалуйста, включите URL, который вы проверяете, и если можно попробовать сохранить свою работу в файл .XEN и прикрепить его. Также проверьте http://windowsupdate.microsoft.com чтобы убедиться, что в вашей системе есть все обновления.Если вы хотите по электронной почте предложение, нажмите здесь.

Список будущих функций

Что я сделаю в будущем (может быть, когда ад замерзнет!):
  • Типы MIME на основе реестра для локального сканирования
  • Запускать локальные файлы в соответствии с типом файла (ShellExecute)
  • Улучшение статистики
    • Итого
    • Классификация ошибок
  • простое преобразование из Unicode
  • РОБОТЫ.текст поддержка
  • Обнаружение удаленной загрузки изображений (это саботирует geocities)
  • Пользовательские представления в Xenu Window

  • Решение для оставшихся файлов TGH *. * Во временном каталоге
  • Параметры командной строки (собственно, это уже было сделано, для клиента которые согласились уделить время моей разработки двум людям, которых я поддерживаю. Если тебе нужно что-то подобное, напишите мне, цена — пожертвование в размере 300 долларов, которое нужно разделить между двумя людьми, которых я поддерживаю)
  • Имена последних проверенных URL-адресов также в меню файла
  • Дополнительная колонка: затраченное время
  • Серверный Link Sleuthing, т.е.е. для использования в качестве приложения CGI, чтобы Интернет-провайдеры могут предлагать своим пользователям поиск каналов, т. Е. Пользователи могут проверять свои собственные веб-сайты.

  • Если вы интернет-провайдер, который готов предложить это, свяжитесь со мной, чтобы поработать детали.
  • Автоматическое сохранение каждую минуту
  • Правильно работающая функция «Обновление», которая повторно проверяет измененные сайты (сложно, так что я никогда этого не сделаю)
  • Проверка внутренних анкеров, проверка дубликатов анкеров
  • Идеи от Криса:
    • Согласование файлов и объектов, принадлежащих странице, для получения общих цифр. для КБ для каждой страницы и перечислить в порядке убывания (TH: это означает что я должен помнить, что это за тип ссылки.)
    • Как насчет того, чтобы определить, сколько шагов нужно, чтобы перейти на определенную страницу? с домашней страницы и сколько килобайт нужно было загрузить, чтобы можно было добраться туда.

    • [TH: полезно, например, какие шаги должен предпринять пользователь, чтобы перейти на страницу конкретного продукта]
  • Читать RFC
  • Файл справки (как только я получу подсказку)
  • Ваш предложения: напишите мне также, если есть что-то из вышеперечисленного, вы бы хотелось бы иметь, и убедите меня сделать это.Если вы хотите сообщить об ошибке, щелкнуть здесь.

История Сыщика Связи Ксену (TM)

(для коллег-разработчиков программного обеспечения)
В апреле и мае 1997 года мой работодатель направил меня на работу за город, потому что другому отделу нужен был парень с опытом работы в MFC. Итак, с понедельника по в пятницу меня не было, а по вечерам мне было до смерти скучно. Каждые выходные Я был дома и обычно проверял свой веб-сайт на наличие битых ссылок с помощью WebAnalyzer.К сожалению, в программном обеспечении было много ошибок, и их служба поддержки игнорировала мои электронных писем, и я был чертовски зол, потому что потратил довольно много денег на продукт, который того не стоил. Моя работа была также первым контактом с VC ++ 4.2 (раньше я работал только с VC ++ 1.5, потому что наши клиенты есть много 16-битных систем), у которых был простой в использовании доступ в Интернет классы. У меня уже был опыт программирования WINSOCK, но эти классы сэкономит мне много времени на оценку заголовков результатов HTTP и других раздражающих вещи.Вечером после отличной итальянской еды с хорошим кьянти Я взял бумагу с письмом в отеле и написал концепцию проверки ссылок. Через месяц мне потребовалось некоторое время, чтобы установить программу разработки на свой компьютер и начал работать, с помощью этой концепции гостиничного номера. Работа велась по вечерам, но в основном по выходным, когда у меня было больше времени.

Моя философия в области разработки программного обеспечения всегда была «меньше, проще, дешевле », задолго до того, как это осознало НАСА.Потому что, Мне не нужна навороченная (но совершенно бесполезная) графика, как в WebAnalyzer. Просто полученные результаты. И лучше бы они были на 100% правы, иначе мне пришлось бы убить себя 🙂

приложение написано на Visual C ++ и максимально использует классы MFC. по возможности: CDocument, CView, CListView, CObArray, CMapStringToOb, CArchive, CInternetSession, CHttpFile и т. Д. И т. Д. Это сэкономило мне много времени!


Кредиты

Иконки в EXE-файле: Мартин Хант и Пол Кэмпбелл; Значок на веб-странице: Эрик Пламмер; Идея использовать баннеры в отчете: Марк Кросс; Логотип Xenu: Fred C.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *