]> git.kernelconcepts.de Git - karo-tx-linux.git/blob - drivers/ata/libata-eh.c
Merge branch 'merge' of git://git.kernel.org/pub/scm/linux/kernel/git/benh/powerpc
[karo-tx-linux.git] / drivers / ata / libata-eh.c
1 /*
2  *  libata-eh.c - libata error handling
3  *
4  *  Maintained by:  Tejun Heo <tj@kernel.org>
5  *                  Please ALWAYS copy linux-ide@vger.kernel.org
6  *                  on emails.
7  *
8  *  Copyright 2006 Tejun Heo <htejun@gmail.com>
9  *
10  *
11  *  This program is free software; you can redistribute it and/or
12  *  modify it under the terms of the GNU General Public License as
13  *  published by the Free Software Foundation; either version 2, or
14  *  (at your option) any later version.
15  *
16  *  This program is distributed in the hope that it will be useful,
17  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
18  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  *  General Public License for more details.
20  *
21  *  You should have received a copy of the GNU General Public License
22  *  along with this program; see the file COPYING.  If not, write to
23  *  the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139,
24  *  USA.
25  *
26  *
27  *  libata documentation is available via 'make {ps|pdf}docs',
28  *  as Documentation/DocBook/libata.*
29  *
30  *  Hardware documentation available from http://www.t13.org/ and
31  *  http://www.sata-io.org/
32  *
33  */
34
35 #include <linux/kernel.h>
36 #include <linux/blkdev.h>
37 #include <linux/export.h>
38 #include <linux/pci.h>
39 #include <scsi/scsi.h>
40 #include <scsi/scsi_host.h>
41 #include <scsi/scsi_eh.h>
42 #include <scsi/scsi_device.h>
43 #include <scsi/scsi_cmnd.h>
44 #include <scsi/scsi_dbg.h>
45 #include "../scsi/scsi_transport_api.h"
46
47 #include <linux/libata.h>
48
49 #include "libata.h"
50
51 enum {
52         /* speed down verdicts */
53         ATA_EH_SPDN_NCQ_OFF             = (1 << 0),
54         ATA_EH_SPDN_SPEED_DOWN          = (1 << 1),
55         ATA_EH_SPDN_FALLBACK_TO_PIO     = (1 << 2),
56         ATA_EH_SPDN_KEEP_ERRORS         = (1 << 3),
57
58         /* error flags */
59         ATA_EFLAG_IS_IO                 = (1 << 0),
60         ATA_EFLAG_DUBIOUS_XFER          = (1 << 1),
61         ATA_EFLAG_OLD_ER                = (1 << 31),
62
63         /* error categories */
64         ATA_ECAT_NONE                   = 0,
65         ATA_ECAT_ATA_BUS                = 1,
66         ATA_ECAT_TOUT_HSM               = 2,
67         ATA_ECAT_UNK_DEV                = 3,
68         ATA_ECAT_DUBIOUS_NONE           = 4,
69         ATA_ECAT_DUBIOUS_ATA_BUS        = 5,
70         ATA_ECAT_DUBIOUS_TOUT_HSM       = 6,
71         ATA_ECAT_DUBIOUS_UNK_DEV        = 7,
72         ATA_ECAT_NR                     = 8,
73
74         ATA_EH_CMD_DFL_TIMEOUT          =  5000,
75
76         /* always put at least this amount of time between resets */
77         ATA_EH_RESET_COOL_DOWN          =  5000,
78
79         /* Waiting in ->prereset can never be reliable.  It's
80          * sometimes nice to wait there but it can't be depended upon;
81          * otherwise, we wouldn't be resetting.  Just give it enough
82          * time for most drives to spin up.
83          */
84         ATA_EH_PRERESET_TIMEOUT         = 10000,
85         ATA_EH_FASTDRAIN_INTERVAL       =  3000,
86
87         ATA_EH_UA_TRIES                 = 5,
88
89         /* probe speed down parameters, see ata_eh_schedule_probe() */
90         ATA_EH_PROBE_TRIAL_INTERVAL     = 60000,        /* 1 min */
91         ATA_EH_PROBE_TRIALS             = 2,
92 };
93
94 /* The following table determines how we sequence resets.  Each entry
95  * represents timeout for that try.  The first try can be soft or
96  * hardreset.  All others are hardreset if available.  In most cases
97  * the first reset w/ 10sec timeout should succeed.  Following entries
98  * are mostly for error handling, hotplug and those outlier devices that
99  * take an exceptionally long time to recover from reset.
100  */
101 static const unsigned long ata_eh_reset_timeouts[] = {
102         10000,  /* most drives spin up by 10sec */
103         10000,  /* > 99% working drives spin up before 20sec */
104         35000,  /* give > 30 secs of idleness for outlier devices */
105          5000,  /* and sweet one last chance */
106         ULONG_MAX, /* > 1 min has elapsed, give up */
107 };
108
109 static const unsigned long ata_eh_identify_timeouts[] = {
110          5000,  /* covers > 99% of successes and not too boring on failures */
111         10000,  /* combined time till here is enough even for media access */
112         30000,  /* for true idiots */
113         ULONG_MAX,
114 };
115
116 static const unsigned long ata_eh_flush_timeouts[] = {
117         15000,  /* be generous with flush */
118         15000,  /* ditto */
119         30000,  /* and even more generous */
120         ULONG_MAX,
121 };
122
123 static const unsigned long ata_eh_other_timeouts[] = {
124          5000,  /* same rationale as identify timeout */
125         10000,  /* ditto */
126         /* but no merciful 30sec for other commands, it just isn't worth it */
127         ULONG_MAX,
128 };
129
130 struct ata_eh_cmd_timeout_ent {
131         const u8                *commands;
132         const unsigned long     *timeouts;
133 };
134
135 /* The following table determines timeouts to use for EH internal
136  * commands.  Each table entry is a command class and matches the
137  * commands the entry applies to and the timeout table to use.
138  *
139  * On the retry after a command timed out, the next timeout value from
140  * the table is used.  If the table doesn't contain further entries,
141  * the last value is used.
142  *
143  * ehc->cmd_timeout_idx keeps track of which timeout to use per
144  * command class, so if SET_FEATURES times out on the first try, the
145  * next try will use the second timeout value only for that class.
146  */
147 #define CMDS(cmds...)   (const u8 []){ cmds, 0 }
148 static const struct ata_eh_cmd_timeout_ent
149 ata_eh_cmd_timeout_table[ATA_EH_CMD_TIMEOUT_TABLE_SIZE] = {
150         { .commands = CMDS(ATA_CMD_ID_ATA, ATA_CMD_ID_ATAPI),
151           .timeouts = ata_eh_identify_timeouts, },
152         { .commands = CMDS(ATA_CMD_READ_NATIVE_MAX, ATA_CMD_READ_NATIVE_MAX_EXT),
153           .timeouts = ata_eh_other_timeouts, },
154         { .commands = CMDS(ATA_CMD_SET_MAX, ATA_CMD_SET_MAX_EXT),
155           .timeouts = ata_eh_other_timeouts, },
156         { .commands = CMDS(ATA_CMD_SET_FEATURES),
157           .timeouts = ata_eh_other_timeouts, },
158         { .commands = CMDS(ATA_CMD_INIT_DEV_PARAMS),
159           .timeouts = ata_eh_other_timeouts, },
160         { .commands = CMDS(ATA_CMD_FLUSH, ATA_CMD_FLUSH_EXT),
161           .timeouts = ata_eh_flush_timeouts },
162 };
163 #undef CMDS
164
165 static void __ata_port_freeze(struct ata_port *ap);
166 #ifdef CONFIG_PM
167 static void ata_eh_handle_port_suspend(struct ata_port *ap);
168 static void ata_eh_handle_port_resume(struct ata_port *ap);
169 #else /* CONFIG_PM */
170 static void ata_eh_handle_port_suspend(struct ata_port *ap)
171 { }
172
173 static void ata_eh_handle_port_resume(struct ata_port *ap)
174 { }
175 #endif /* CONFIG_PM */
176
177 static void __ata_ehi_pushv_desc(struct ata_eh_info *ehi, const char *fmt,
178                                  va_list args)
179 {
180         ehi->desc_len += vscnprintf(ehi->desc + ehi->desc_len,
181                                      ATA_EH_DESC_LEN - ehi->desc_len,
182                                      fmt, args);
183 }
184
185 /**
186  *      __ata_ehi_push_desc - push error description without adding separator
187  *      @ehi: target EHI
188  *      @fmt: printf format string
189  *
190  *      Format string according to @fmt and append it to @ehi->desc.
191  *
192  *      LOCKING:
193  *      spin_lock_irqsave(host lock)
194  */
195 void __ata_ehi_push_desc(struct ata_eh_info *ehi, const char *fmt, ...)
196 {
197         va_list args;
198
199         va_start(args, fmt);
200         __ata_ehi_pushv_desc(ehi, fmt, args);
201         va_end(args);
202 }
203
204 /**
205  *      ata_ehi_push_desc - push error description with separator
206  *      @ehi: target EHI
207  *      @fmt: printf format string
208  *
209  *      Format string according to @fmt and append it to @ehi->desc.
210  *      If @ehi->desc is not empty, ", " is added in-between.
211  *
212  *      LOCKING:
213  *      spin_lock_irqsave(host lock)
214  */
215 void ata_ehi_push_desc(struct ata_eh_info *ehi, const char *fmt, ...)
216 {
217         va_list args;
218
219         if (ehi->desc_len)
220                 __ata_ehi_push_desc(ehi, ", ");
221
222         va_start(args, fmt);
223         __ata_ehi_pushv_desc(ehi, fmt, args);
224         va_end(args);
225 }
226
227 /**
228  *      ata_ehi_clear_desc - clean error description
229  *      @ehi: target EHI
230  *
231  *      Clear @ehi->desc.
232  *
233  *      LOCKING:
234  *      spin_lock_irqsave(host lock)
235  */
236 void ata_ehi_clear_desc(struct ata_eh_info *ehi)
237 {
238         ehi->desc[0] = '\0';
239         ehi->desc_len = 0;
240 }
241
242 /**
243  *      ata_port_desc - append port description
244  *      @ap: target ATA port
245  *      @fmt: printf format string
246  *
247  *      Format string according to @fmt and append it to port
248  *      description.  If port description is not empty, " " is added
249  *      in-between.  This function is to be used while initializing
250  *      ata_host.  The description is printed on host registration.
251  *
252  *      LOCKING:
253  *      None.
254  */
255 void ata_port_desc(struct ata_port *ap, const char *fmt, ...)
256 {
257         va_list args;
258
259         WARN_ON(!(ap->pflags & ATA_PFLAG_INITIALIZING));
260
261         if (ap->link.eh_info.desc_len)
262                 __ata_ehi_push_desc(&ap->link.eh_info, " ");
263
264         va_start(args, fmt);
265         __ata_ehi_pushv_desc(&ap->link.eh_info, fmt, args);
266         va_end(args);
267 }
268
269 #ifdef CONFIG_PCI
270
271 /**
272  *      ata_port_pbar_desc - append PCI BAR description
273  *      @ap: target ATA port
274  *      @bar: target PCI BAR
275  *      @offset: offset into PCI BAR
276  *      @name: name of the area
277  *
278  *      If @offset is negative, this function formats a string which
279  *      contains the name, address, size and type of the BAR and
280  *      appends it to the port description.  If @offset is zero or
281  *      positive, only name and offsetted address is appended.
282  *
283  *      LOCKING:
284  *      None.
285  */
286 void ata_port_pbar_desc(struct ata_port *ap, int bar, ssize_t offset,
287                         const char *name)
288 {
289         struct pci_dev *pdev = to_pci_dev(ap->host->dev);
290         char *type = "";
291         unsigned long long start, len;
292
293         if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM)
294                 type = "m";
295         else if (pci_resource_flags(pdev, bar) & IORESOURCE_IO)
296                 type = "i";
297
298         start = (unsigned long long)pci_resource_start(pdev, bar);
299         len = (unsigned long long)pci_resource_len(pdev, bar);
300
301         if (offset < 0)
302                 ata_port_desc(ap, "%s %s%llu@0x%llx", name, type, len, start);
303         else
304                 ata_port_desc(ap, "%s 0x%llx", name,
305                                 start + (unsigned long long)offset);
306 }
307
308 #endif /* CONFIG_PCI */
309
310 static int ata_lookup_timeout_table(u8 cmd)
311 {
312         int i;
313
314         for (i = 0; i < ATA_EH_CMD_TIMEOUT_TABLE_SIZE; i++) {
315                 const u8 *cur;
316
317                 for (cur = ata_eh_cmd_timeout_table[i].commands; *cur; cur++)
318                         if (*cur == cmd)
319                                 return i;
320         }
321
322         return -1;
323 }
324
325 /**
326  *      ata_internal_cmd_timeout - determine timeout for an internal command
327  *      @dev: target device
328  *      @cmd: internal command to be issued
329  *
330  *      Determine timeout for internal command @cmd for @dev.
331  *
332  *      LOCKING:
333  *      EH context.
334  *
335  *      RETURNS:
336  *      Determined timeout.
337  */
338 unsigned long ata_internal_cmd_timeout(struct ata_device *dev, u8 cmd)
339 {
340         struct ata_eh_context *ehc = &dev->link->eh_context;
341         int ent = ata_lookup_timeout_table(cmd);
342         int idx;
343
344         if (ent < 0)
345                 return ATA_EH_CMD_DFL_TIMEOUT;
346
347         idx = ehc->cmd_timeout_idx[dev->devno][ent];
348         return ata_eh_cmd_timeout_table[ent].timeouts[idx];
349 }
350
351 /**
352  *      ata_internal_cmd_timed_out - notification for internal command timeout
353  *      @dev: target device
354  *      @cmd: internal command which timed out
355  *
356  *      Notify EH that internal command @cmd for @dev timed out.  This
357  *      function should be called only for commands whose timeouts are
358  *      determined using ata_internal_cmd_timeout().
359  *
360  *      LOCKING:
361  *      EH context.
362  */
363 void ata_internal_cmd_timed_out(struct ata_device *dev, u8 cmd)
364 {
365         struct ata_eh_context *ehc = &dev->link->eh_context;
366         int ent = ata_lookup_timeout_table(cmd);
367         int idx;
368
369         if (ent < 0)
370                 return;
371
372         idx = ehc->cmd_timeout_idx[dev->devno][ent];
373         if (ata_eh_cmd_timeout_table[ent].timeouts[idx + 1] != ULONG_MAX)
374                 ehc->cmd_timeout_idx[dev->devno][ent]++;
375 }
376
377 static void ata_ering_record(struct ata_ering *ering, unsigned int eflags,
378                              unsigned int err_mask)
379 {
380         struct ata_ering_entry *ent;
381
382         WARN_ON(!err_mask);
383
384         ering->cursor++;
385         ering->cursor %= ATA_ERING_SIZE;
386
387         ent = &ering->ring[ering->cursor];
388         ent->eflags = eflags;
389         ent->err_mask = err_mask;
390         ent->timestamp = get_jiffies_64();
391 }
392
393 static struct ata_ering_entry *ata_ering_top(struct ata_ering *ering)
394 {
395         struct ata_ering_entry *ent = &ering->ring[ering->cursor];
396
397         if (ent->err_mask)
398                 return ent;
399         return NULL;
400 }
401
402 int ata_ering_map(struct ata_ering *ering,
403                   int (*map_fn)(struct ata_ering_entry *, void *),
404                   void *arg)
405 {
406         int idx, rc = 0;
407         struct ata_ering_entry *ent;
408
409         idx = ering->cursor;
410         do {
411                 ent = &ering->ring[idx];
412                 if (!ent->err_mask)
413                         break;
414                 rc = map_fn(ent, arg);
415                 if (rc)
416                         break;
417                 idx = (idx - 1 + ATA_ERING_SIZE) % ATA_ERING_SIZE;
418         } while (idx != ering->cursor);
419
420         return rc;
421 }
422
423 static int ata_ering_clear_cb(struct ata_ering_entry *ent, void *void_arg)
424 {
425         ent->eflags |= ATA_EFLAG_OLD_ER;
426         return 0;
427 }
428
429 static void ata_ering_clear(struct ata_ering *ering)
430 {
431         ata_ering_map(ering, ata_ering_clear_cb, NULL);
432 }
433
434 static unsigned int ata_eh_dev_action(struct ata_device *dev)
435 {
436         struct ata_eh_context *ehc = &dev->link->eh_context;
437
438         return ehc->i.action | ehc->i.dev_action[dev->devno];
439 }
440
441 static void ata_eh_clear_action(struct ata_link *link, struct ata_device *dev,
442                                 struct ata_eh_info *ehi, unsigned int action)
443 {
444         struct ata_device *tdev;
445
446         if (!dev) {
447                 ehi->action &= ~action;
448                 ata_for_each_dev(tdev, link, ALL)
449                         ehi->dev_action[tdev->devno] &= ~action;
450         } else {
451                 /* doesn't make sense for port-wide EH actions */
452                 WARN_ON(!(action & ATA_EH_PERDEV_MASK));
453
454                 /* break ehi->action into ehi->dev_action */
455                 if (ehi->action & action) {
456                         ata_for_each_dev(tdev, link, ALL)
457                                 ehi->dev_action[tdev->devno] |=
458                                         ehi->action & action;
459                         ehi->action &= ~action;
460                 }
461
462                 /* turn off the specified per-dev action */
463                 ehi->dev_action[dev->devno] &= ~action;
464         }
465 }
466
467 /**
468  *      ata_eh_acquire - acquire EH ownership
469  *      @ap: ATA port to acquire EH ownership for
470  *
471  *      Acquire EH ownership for @ap.  This is the basic exclusion
472  *      mechanism for ports sharing a host.  Only one port hanging off
473  *      the same host can claim the ownership of EH.
474  *
475  *      LOCKING:
476  *      EH context.
477  */
478 void ata_eh_acquire(struct ata_port *ap)
479 {
480         mutex_lock(&ap->host->eh_mutex);
481         WARN_ON_ONCE(ap->host->eh_owner);
482         ap->host->eh_owner = current;
483 }
484
485 /**
486  *      ata_eh_release - release EH ownership
487  *      @ap: ATA port to release EH ownership for
488  *
489  *      Release EH ownership for @ap if the caller.  The caller must
490  *      have acquired EH ownership using ata_eh_acquire() previously.
491  *
492  *      LOCKING:
493  *      EH context.
494  */
495 void ata_eh_release(struct ata_port *ap)
496 {
497         WARN_ON_ONCE(ap->host->eh_owner != current);
498         ap->host->eh_owner = NULL;
499         mutex_unlock(&ap->host->eh_mutex);
500 }
501
502 /**
503  *      ata_scsi_timed_out - SCSI layer time out callback
504  *      @cmd: timed out SCSI command
505  *
506  *      Handles SCSI layer timeout.  We race with normal completion of
507  *      the qc for @cmd.  If the qc is already gone, we lose and let
508  *      the scsi command finish (EH_HANDLED).  Otherwise, the qc has
509  *      timed out and EH should be invoked.  Prevent ata_qc_complete()
510  *      from finishing it by setting EH_SCHEDULED and return
511  *      EH_NOT_HANDLED.
512  *
513  *      TODO: kill this function once old EH is gone.
514  *
515  *      LOCKING:
516  *      Called from timer context
517  *
518  *      RETURNS:
519  *      EH_HANDLED or EH_NOT_HANDLED
520  */
521 enum blk_eh_timer_return ata_scsi_timed_out(struct scsi_cmnd *cmd)
522 {
523         struct Scsi_Host *host = cmd->device->host;
524         struct ata_port *ap = ata_shost_to_port(host);
525         unsigned long flags;
526         struct ata_queued_cmd *qc;
527         enum blk_eh_timer_return ret;
528
529         DPRINTK("ENTER\n");
530
531         if (ap->ops->error_handler) {
532                 ret = BLK_EH_NOT_HANDLED;
533                 goto out;
534         }
535
536         ret = BLK_EH_HANDLED;
537         spin_lock_irqsave(ap->lock, flags);
538         qc = ata_qc_from_tag(ap, ap->link.active_tag);
539         if (qc) {
540                 WARN_ON(qc->scsicmd != cmd);
541                 qc->flags |= ATA_QCFLAG_EH_SCHEDULED;
542                 qc->err_mask |= AC_ERR_TIMEOUT;
543                 ret = BLK_EH_NOT_HANDLED;
544         }
545         spin_unlock_irqrestore(ap->lock, flags);
546
547  out:
548         DPRINTK("EXIT, ret=%d\n", ret);
549         return ret;
550 }
551
552 static void ata_eh_unload(struct ata_port *ap)
553 {
554         struct ata_link *link;
555         struct ata_device *dev;
556         unsigned long flags;
557
558         /* Restore SControl IPM and SPD for the next driver and
559          * disable attached devices.
560          */
561         ata_for_each_link(link, ap, PMP_FIRST) {
562                 sata_scr_write(link, SCR_CONTROL, link->saved_scontrol & 0xff0);
563                 ata_for_each_dev(dev, link, ALL)
564                         ata_dev_disable(dev);
565         }
566
567         /* freeze and set UNLOADED */
568         spin_lock_irqsave(ap->lock, flags);
569
570         ata_port_freeze(ap);                    /* won't be thawed */
571         ap->pflags &= ~ATA_PFLAG_EH_PENDING;    /* clear pending from freeze */
572         ap->pflags |= ATA_PFLAG_UNLOADED;
573
574         spin_unlock_irqrestore(ap->lock, flags);
575 }
576
577 /**
578  *      ata_scsi_error - SCSI layer error handler callback
579  *      @host: SCSI host on which error occurred
580  *
581  *      Handles SCSI-layer-thrown error events.
582  *
583  *      LOCKING:
584  *      Inherited from SCSI layer (none, can sleep)
585  *
586  *      RETURNS:
587  *      Zero.
588  */
589 void ata_scsi_error(struct Scsi_Host *host)
590 {
591         struct ata_port *ap = ata_shost_to_port(host);
592         unsigned long flags;
593         LIST_HEAD(eh_work_q);
594
595         DPRINTK("ENTER\n");
596
597         spin_lock_irqsave(host->host_lock, flags);
598         list_splice_init(&host->eh_cmd_q, &eh_work_q);
599         spin_unlock_irqrestore(host->host_lock, flags);
600
601         ata_scsi_cmd_error_handler(host, ap, &eh_work_q);
602
603         /* If we timed raced normal completion and there is nothing to
604            recover nr_timedout == 0 why exactly are we doing error recovery ? */
605         ata_scsi_port_error_handler(host, ap);
606
607         /* finish or retry handled scmd's and clean up */
608         WARN_ON(host->host_failed || !list_empty(&eh_work_q));
609
610         DPRINTK("EXIT\n");
611 }
612
613 /**
614  * ata_scsi_cmd_error_handler - error callback for a list of commands
615  * @host:       scsi host containing the port
616  * @ap:         ATA port within the host
617  * @eh_work_q:  list of commands to process
618  *
619  * process the given list of commands and return those finished to the
620  * ap->eh_done_q.  This function is the first part of the libata error
621  * handler which processes a given list of failed commands.
622  */
623 void ata_scsi_cmd_error_handler(struct Scsi_Host *host, struct ata_port *ap,
624                                 struct list_head *eh_work_q)
625 {
626         int i;
627         unsigned long flags;
628
629         /* make sure sff pio task is not running */
630         ata_sff_flush_pio_task(ap);
631
632         /* synchronize with host lock and sort out timeouts */
633
634         /* For new EH, all qcs are finished in one of three ways -
635          * normal completion, error completion, and SCSI timeout.
636          * Both completions can race against SCSI timeout.  When normal
637          * completion wins, the qc never reaches EH.  When error
638          * completion wins, the qc has ATA_QCFLAG_FAILED set.
639          *
640          * When SCSI timeout wins, things are a bit more complex.
641          * Normal or error completion can occur after the timeout but
642          * before this point.  In such cases, both types of
643          * completions are honored.  A scmd is determined to have
644          * timed out iff its associated qc is active and not failed.
645          */
646         if (ap->ops->error_handler) {
647                 struct scsi_cmnd *scmd, *tmp;
648                 int nr_timedout = 0;
649
650                 spin_lock_irqsave(ap->lock, flags);
651
652                 /* This must occur under the ap->lock as we don't want
653                    a polled recovery to race the real interrupt handler
654
655                    The lost_interrupt handler checks for any completed but
656                    non-notified command and completes much like an IRQ handler.
657
658                    We then fall into the error recovery code which will treat
659                    this as if normal completion won the race */
660
661                 if (ap->ops->lost_interrupt)
662                         ap->ops->lost_interrupt(ap);
663
664                 list_for_each_entry_safe(scmd, tmp, eh_work_q, eh_entry) {
665                         struct ata_queued_cmd *qc;
666
667                         for (i = 0; i < ATA_MAX_QUEUE; i++) {
668                                 qc = __ata_qc_from_tag(ap, i);
669                                 if (qc->flags & ATA_QCFLAG_ACTIVE &&
670                                     qc->scsicmd == scmd)
671                                         break;
672                         }
673
674                         if (i < ATA_MAX_QUEUE) {
675                                 /* the scmd has an associated qc */
676                                 if (!(qc->flags & ATA_QCFLAG_FAILED)) {
677                                         /* which hasn't failed yet, timeout */
678                                         qc->err_mask |= AC_ERR_TIMEOUT;
679                                         qc->flags |= ATA_QCFLAG_FAILED;
680                                         nr_timedout++;
681                                 }
682                         } else {
683                                 /* Normal completion occurred after
684                                  * SCSI timeout but before this point.
685                                  * Successfully complete it.
686                                  */
687                                 scmd->retries = scmd->allowed;
688                                 scsi_eh_finish_cmd(scmd, &ap->eh_done_q);
689                         }
690                 }
691
692                 /* If we have timed out qcs.  They belong to EH from
693                  * this point but the state of the controller is
694                  * unknown.  Freeze the port to make sure the IRQ
695                  * handler doesn't diddle with those qcs.  This must
696                  * be done atomically w.r.t. setting QCFLAG_FAILED.
697                  */
698                 if (nr_timedout)
699                         __ata_port_freeze(ap);
700
701                 spin_unlock_irqrestore(ap->lock, flags);
702
703                 /* initialize eh_tries */
704                 ap->eh_tries = ATA_EH_MAX_TRIES;
705         } else
706                 spin_unlock_wait(ap->lock);
707
708 }
709 EXPORT_SYMBOL(ata_scsi_cmd_error_handler);
710
711 /**
712  * ata_scsi_port_error_handler - recover the port after the commands
713  * @host:       SCSI host containing the port
714  * @ap:         the ATA port
715  *
716  * Handle the recovery of the port @ap after all the commands
717  * have been recovered.
718  */
719 void ata_scsi_port_error_handler(struct Scsi_Host *host, struct ata_port *ap)
720 {
721         unsigned long flags;
722
723         /* invoke error handler */
724         if (ap->ops->error_handler) {
725                 struct ata_link *link;
726
727                 /* acquire EH ownership */
728                 ata_eh_acquire(ap);
729  repeat:
730                 /* kill fast drain timer */
731                 del_timer_sync(&ap->fastdrain_timer);
732
733                 /* process port resume request */
734                 ata_eh_handle_port_resume(ap);
735
736                 /* fetch & clear EH info */
737                 spin_lock_irqsave(ap->lock, flags);
738
739                 ata_for_each_link(link, ap, HOST_FIRST) {
740                         struct ata_eh_context *ehc = &link->eh_context;
741                         struct ata_device *dev;
742
743                         memset(&link->eh_context, 0, sizeof(link->eh_context));
744                         link->eh_context.i = link->eh_info;
745                         memset(&link->eh_info, 0, sizeof(link->eh_info));
746
747                         ata_for_each_dev(dev, link, ENABLED) {
748                                 int devno = dev->devno;
749
750                                 ehc->saved_xfer_mode[devno] = dev->xfer_mode;
751                                 if (ata_ncq_enabled(dev))
752                                         ehc->saved_ncq_enabled |= 1 << devno;
753                         }
754                 }
755
756                 ap->pflags |= ATA_PFLAG_EH_IN_PROGRESS;
757                 ap->pflags &= ~ATA_PFLAG_EH_PENDING;
758                 ap->excl_link = NULL;   /* don't maintain exclusion over EH */
759
760                 spin_unlock_irqrestore(ap->lock, flags);
761
762                 /* invoke EH, skip if unloading or suspended */
763                 if (!(ap->pflags & (ATA_PFLAG_UNLOADING | ATA_PFLAG_SUSPENDED)))
764                         ap->ops->error_handler(ap);
765                 else {
766                         /* if unloading, commence suicide */
767                         if ((ap->pflags & ATA_PFLAG_UNLOADING) &&
768                             !(ap->pflags & ATA_PFLAG_UNLOADED))
769                                 ata_eh_unload(ap);
770                         ata_eh_finish(ap);
771                 }
772
773                 /* process port suspend request */
774                 ata_eh_handle_port_suspend(ap);
775
776                 /* Exception might have happened after ->error_handler
777                  * recovered the port but before this point.  Repeat
778                  * EH in such case.
779                  */
780                 spin_lock_irqsave(ap->lock, flags);
781
782                 if (ap->pflags & ATA_PFLAG_EH_PENDING) {
783                         if (--ap->eh_tries) {
784                                 spin_unlock_irqrestore(ap->lock, flags);
785                                 goto repeat;
786                         }
787                         ata_port_err(ap,
788                                      "EH pending after %d tries, giving up\n",
789                                      ATA_EH_MAX_TRIES);
790                         ap->pflags &= ~ATA_PFLAG_EH_PENDING;
791                 }
792
793                 /* this run is complete, make sure EH info is clear */
794                 ata_for_each_link(link, ap, HOST_FIRST)
795                         memset(&link->eh_info, 0, sizeof(link->eh_info));
796
797                 /* end eh (clear host_eh_scheduled) while holding
798                  * ap->lock such that if exception occurs after this
799                  * point but before EH completion, SCSI midlayer will
800                  * re-initiate EH.
801                  */
802                 ap->ops->end_eh(ap);
803
804                 spin_unlock_irqrestore(ap->lock, flags);
805                 ata_eh_release(ap);
806         } else {
807                 WARN_ON(ata_qc_from_tag(ap, ap->link.active_tag) == NULL);
808                 ap->ops->eng_timeout(ap);
809         }
810
811         scsi_eh_flush_done_q(&ap->eh_done_q);
812
813         /* clean up */
814         spin_lock_irqsave(ap->lock, flags);
815
816         if (ap->pflags & ATA_PFLAG_LOADING)
817                 ap->pflags &= ~ATA_PFLAG_LOADING;
818         else if (ap->pflags & ATA_PFLAG_SCSI_HOTPLUG)
819                 schedule_delayed_work(&ap->hotplug_task, 0);
820
821         if (ap->pflags & ATA_PFLAG_RECOVERED)
822                 ata_port_info(ap, "EH complete\n");
823
824         ap->pflags &= ~(ATA_PFLAG_SCSI_HOTPLUG | ATA_PFLAG_RECOVERED);
825
826         /* tell wait_eh that we're done */
827         ap->pflags &= ~ATA_PFLAG_EH_IN_PROGRESS;
828         wake_up_all(&ap->eh_wait_q);
829
830         spin_unlock_irqrestore(ap->lock, flags);
831 }
832 EXPORT_SYMBOL_GPL(ata_scsi_port_error_handler);
833
834 /**
835  *      ata_port_wait_eh - Wait for the currently pending EH to complete
836  *      @ap: Port to wait EH for
837  *
838  *      Wait until the currently pending EH is complete.
839  *
840  *      LOCKING:
841  *      Kernel thread context (may sleep).
842  */
843 void ata_port_wait_eh(struct ata_port *ap)
844 {
845         unsigned long flags;
846         DEFINE_WAIT(wait);
847
848  retry:
849         spin_lock_irqsave(ap->lock, flags);
850
851         while (ap->pflags & (ATA_PFLAG_EH_PENDING | ATA_PFLAG_EH_IN_PROGRESS)) {
852                 prepare_to_wait(&ap->eh_wait_q, &wait, TASK_UNINTERRUPTIBLE);
853                 spin_unlock_irqrestore(ap->lock, flags);
854                 schedule();
855                 spin_lock_irqsave(ap->lock, flags);
856         }
857         finish_wait(&ap->eh_wait_q, &wait);
858
859         spin_unlock_irqrestore(ap->lock, flags);
860
861         /* make sure SCSI EH is complete */
862         if (scsi_host_in_recovery(ap->scsi_host)) {
863                 ata_msleep(ap, 10);
864                 goto retry;
865         }
866 }
867 EXPORT_SYMBOL_GPL(ata_port_wait_eh);
868
869 static int ata_eh_nr_in_flight(struct ata_port *ap)
870 {
871         unsigned int tag;
872         int nr = 0;
873
874         /* count only non-internal commands */
875         for (tag = 0; tag < ATA_MAX_QUEUE - 1; tag++)
876                 if (ata_qc_from_tag(ap, tag))
877                         nr++;
878
879         return nr;
880 }
881
882 void ata_eh_fastdrain_timerfn(unsigned long arg)
883 {
884         struct ata_port *ap = (void *)arg;
885         unsigned long flags;
886         int cnt;
887
888         spin_lock_irqsave(ap->lock, flags);
889
890         cnt = ata_eh_nr_in_flight(ap);
891
892         /* are we done? */
893         if (!cnt)
894                 goto out_unlock;
895
896         if (cnt == ap->fastdrain_cnt) {
897                 unsigned int tag;
898
899                 /* No progress during the last interval, tag all
900                  * in-flight qcs as timed out and freeze the port.
901                  */
902                 for (tag = 0; tag < ATA_MAX_QUEUE - 1; tag++) {
903                         struct ata_queued_cmd *qc = ata_qc_from_tag(ap, tag);
904                         if (qc)
905                                 qc->err_mask |= AC_ERR_TIMEOUT;
906                 }
907
908                 ata_port_freeze(ap);
909         } else {
910                 /* some qcs have finished, give it another chance */
911                 ap->fastdrain_cnt = cnt;
912                 ap->fastdrain_timer.expires =
913                         ata_deadline(jiffies, ATA_EH_FASTDRAIN_INTERVAL);
914                 add_timer(&ap->fastdrain_timer);
915         }
916
917  out_unlock:
918         spin_unlock_irqrestore(ap->lock, flags);
919 }
920
921 /**
922  *      ata_eh_set_pending - set ATA_PFLAG_EH_PENDING and activate fast drain
923  *      @ap: target ATA port
924  *      @fastdrain: activate fast drain
925  *
926  *      Set ATA_PFLAG_EH_PENDING and activate fast drain if @fastdrain
927  *      is non-zero and EH wasn't pending before.  Fast drain ensures
928  *      that EH kicks in in timely manner.
929  *
930  *      LOCKING:
931  *      spin_lock_irqsave(host lock)
932  */
933 static void ata_eh_set_pending(struct ata_port *ap, int fastdrain)
934 {
935         int cnt;
936
937         /* already scheduled? */
938         if (ap->pflags & ATA_PFLAG_EH_PENDING)
939                 return;
940
941         ap->pflags |= ATA_PFLAG_EH_PENDING;
942
943         if (!fastdrain)
944                 return;
945
946         /* do we have in-flight qcs? */
947         cnt = ata_eh_nr_in_flight(ap);
948         if (!cnt)
949                 return;
950
951         /* activate fast drain */
952         ap->fastdrain_cnt = cnt;
953         ap->fastdrain_timer.expires =
954                 ata_deadline(jiffies, ATA_EH_FASTDRAIN_INTERVAL);
955         add_timer(&ap->fastdrain_timer);
956 }
957
958 /**
959  *      ata_qc_schedule_eh - schedule qc for error handling
960  *      @qc: command to schedule error handling for
961  *
962  *      Schedule error handling for @qc.  EH will kick in as soon as
963  *      other commands are drained.
964  *
965  *      LOCKING:
966  *      spin_lock_irqsave(host lock)
967  */
968 void ata_qc_schedule_eh(struct ata_queued_cmd *qc)
969 {
970         struct ata_port *ap = qc->ap;
971         struct request_queue *q = qc->scsicmd->device->request_queue;
972         unsigned long flags;
973
974         WARN_ON(!ap->ops->error_handler);
975
976         qc->flags |= ATA_QCFLAG_FAILED;
977         ata_eh_set_pending(ap, 1);
978
979         /* The following will fail if timeout has already expired.
980          * ata_scsi_error() takes care of such scmds on EH entry.
981          * Note that ATA_QCFLAG_FAILED is unconditionally set after
982          * this function completes.
983          */
984         spin_lock_irqsave(q->queue_lock, flags);
985         blk_abort_request(qc->scsicmd->request);
986         spin_unlock_irqrestore(q->queue_lock, flags);
987 }
988
989 /**
990  * ata_std_sched_eh - non-libsas ata_ports issue eh with this common routine
991  * @ap: ATA port to schedule EH for
992  *
993  *      LOCKING: inherited from ata_port_schedule_eh
994  *      spin_lock_irqsave(host lock)
995  */
996 void ata_std_sched_eh(struct ata_port *ap)
997 {
998         WARN_ON(!ap->ops->error_handler);
999
1000         if (ap->pflags & ATA_PFLAG_INITIALIZING)
1001                 return;
1002
1003         ata_eh_set_pending(ap, 1);
1004         scsi_schedule_eh(ap->scsi_host);
1005
1006         DPRINTK("port EH scheduled\n");
1007 }
1008 EXPORT_SYMBOL_GPL(ata_std_sched_eh);
1009
1010 /**
1011  * ata_std_end_eh - non-libsas ata_ports complete eh with this common routine
1012  * @ap: ATA port to end EH for
1013  *
1014  * In the libata object model there is a 1:1 mapping of ata_port to
1015  * shost, so host fields can be directly manipulated under ap->lock, in
1016  * the libsas case we need to hold a lock at the ha->level to coordinate
1017  * these events.
1018  *
1019  *      LOCKING:
1020  *      spin_lock_irqsave(host lock)
1021  */
1022 void ata_std_end_eh(struct ata_port *ap)
1023 {
1024         struct Scsi_Host *host = ap->scsi_host;
1025
1026         host->host_eh_scheduled = 0;
1027 }
1028 EXPORT_SYMBOL(ata_std_end_eh);
1029
1030
1031 /**
1032  *      ata_port_schedule_eh - schedule error handling without a qc
1033  *      @ap: ATA port to schedule EH for
1034  *
1035  *      Schedule error handling for @ap.  EH will kick in as soon as
1036  *      all commands are drained.
1037  *
1038  *      LOCKING:
1039  *      spin_lock_irqsave(host lock)
1040  */
1041 void ata_port_schedule_eh(struct ata_port *ap)
1042 {
1043         /* see: ata_std_sched_eh, unless you know better */
1044         ap->ops->sched_eh(ap);
1045 }
1046
1047 static int ata_do_link_abort(struct ata_port *ap, struct ata_link *link)
1048 {
1049         int tag, nr_aborted = 0;
1050
1051         WARN_ON(!ap->ops->error_handler);
1052
1053         /* we're gonna abort all commands, no need for fast drain */
1054         ata_eh_set_pending(ap, 0);
1055
1056         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
1057                 struct ata_queued_cmd *qc = ata_qc_from_tag(ap, tag);
1058
1059                 if (qc && (!link || qc->dev->link == link)) {
1060                         qc->flags |= ATA_QCFLAG_FAILED;
1061                         ata_qc_complete(qc);
1062                         nr_aborted++;
1063                 }
1064         }
1065
1066         if (!nr_aborted)
1067                 ata_port_schedule_eh(ap);
1068
1069         return nr_aborted;
1070 }
1071
1072 /**
1073  *      ata_link_abort - abort all qc's on the link
1074  *      @link: ATA link to abort qc's for
1075  *
1076  *      Abort all active qc's active on @link and schedule EH.
1077  *
1078  *      LOCKING:
1079  *      spin_lock_irqsave(host lock)
1080  *
1081  *      RETURNS:
1082  *      Number of aborted qc's.
1083  */
1084 int ata_link_abort(struct ata_link *link)
1085 {
1086         return ata_do_link_abort(link->ap, link);
1087 }
1088
1089 /**
1090  *      ata_port_abort - abort all qc's on the port
1091  *      @ap: ATA port to abort qc's for
1092  *
1093  *      Abort all active qc's of @ap and schedule EH.
1094  *
1095  *      LOCKING:
1096  *      spin_lock_irqsave(host_set lock)
1097  *
1098  *      RETURNS:
1099  *      Number of aborted qc's.
1100  */
1101 int ata_port_abort(struct ata_port *ap)
1102 {
1103         return ata_do_link_abort(ap, NULL);
1104 }
1105
1106 /**
1107  *      __ata_port_freeze - freeze port
1108  *      @ap: ATA port to freeze
1109  *
1110  *      This function is called when HSM violation or some other
1111  *      condition disrupts normal operation of the port.  Frozen port
1112  *      is not allowed to perform any operation until the port is
1113  *      thawed, which usually follows a successful reset.
1114  *
1115  *      ap->ops->freeze() callback can be used for freezing the port
1116  *      hardware-wise (e.g. mask interrupt and stop DMA engine).  If a
1117  *      port cannot be frozen hardware-wise, the interrupt handler
1118  *      must ack and clear interrupts unconditionally while the port
1119  *      is frozen.
1120  *
1121  *      LOCKING:
1122  *      spin_lock_irqsave(host lock)
1123  */
1124 static void __ata_port_freeze(struct ata_port *ap)
1125 {
1126         WARN_ON(!ap->ops->error_handler);
1127
1128         if (ap->ops->freeze)
1129                 ap->ops->freeze(ap);
1130
1131         ap->pflags |= ATA_PFLAG_FROZEN;
1132
1133         DPRINTK("ata%u port frozen\n", ap->print_id);
1134 }
1135
1136 /**
1137  *      ata_port_freeze - abort & freeze port
1138  *      @ap: ATA port to freeze
1139  *
1140  *      Abort and freeze @ap.  The freeze operation must be called
1141  *      first, because some hardware requires special operations
1142  *      before the taskfile registers are accessible.
1143  *
1144  *      LOCKING:
1145  *      spin_lock_irqsave(host lock)
1146  *
1147  *      RETURNS:
1148  *      Number of aborted commands.
1149  */
1150 int ata_port_freeze(struct ata_port *ap)
1151 {
1152         int nr_aborted;
1153
1154         WARN_ON(!ap->ops->error_handler);
1155
1156         __ata_port_freeze(ap);
1157         nr_aborted = ata_port_abort(ap);
1158
1159         return nr_aborted;
1160 }
1161
1162 /**
1163  *      sata_async_notification - SATA async notification handler
1164  *      @ap: ATA port where async notification is received
1165  *
1166  *      Handler to be called when async notification via SDB FIS is
1167  *      received.  This function schedules EH if necessary.
1168  *
1169  *      LOCKING:
1170  *      spin_lock_irqsave(host lock)
1171  *
1172  *      RETURNS:
1173  *      1 if EH is scheduled, 0 otherwise.
1174  */
1175 int sata_async_notification(struct ata_port *ap)
1176 {
1177         u32 sntf;
1178         int rc;
1179
1180         if (!(ap->flags & ATA_FLAG_AN))
1181                 return 0;
1182
1183         rc = sata_scr_read(&ap->link, SCR_NOTIFICATION, &sntf);
1184         if (rc == 0)
1185                 sata_scr_write(&ap->link, SCR_NOTIFICATION, sntf);
1186
1187         if (!sata_pmp_attached(ap) || rc) {
1188                 /* PMP is not attached or SNTF is not available */
1189                 if (!sata_pmp_attached(ap)) {
1190                         /* PMP is not attached.  Check whether ATAPI
1191                          * AN is configured.  If so, notify media
1192                          * change.
1193                          */
1194                         struct ata_device *dev = ap->link.device;
1195
1196                         if ((dev->class == ATA_DEV_ATAPI) &&
1197                             (dev->flags & ATA_DFLAG_AN))
1198                                 ata_scsi_media_change_notify(dev);
1199                         return 0;
1200                 } else {
1201                         /* PMP is attached but SNTF is not available.
1202                          * ATAPI async media change notification is
1203                          * not used.  The PMP must be reporting PHY
1204                          * status change, schedule EH.
1205                          */
1206                         ata_port_schedule_eh(ap);
1207                         return 1;
1208                 }
1209         } else {
1210                 /* PMP is attached and SNTF is available */
1211                 struct ata_link *link;
1212
1213                 /* check and notify ATAPI AN */
1214                 ata_for_each_link(link, ap, EDGE) {
1215                         if (!(sntf & (1 << link->pmp)))
1216                                 continue;
1217
1218                         if ((link->device->class == ATA_DEV_ATAPI) &&
1219                             (link->device->flags & ATA_DFLAG_AN))
1220                                 ata_scsi_media_change_notify(link->device);
1221                 }
1222
1223                 /* If PMP is reporting that PHY status of some
1224                  * downstream ports has changed, schedule EH.
1225                  */
1226                 if (sntf & (1 << SATA_PMP_CTRL_PORT)) {
1227                         ata_port_schedule_eh(ap);
1228                         return 1;
1229                 }
1230
1231                 return 0;
1232         }
1233 }
1234
1235 /**
1236  *      ata_eh_freeze_port - EH helper to freeze port
1237  *      @ap: ATA port to freeze
1238  *
1239  *      Freeze @ap.
1240  *
1241  *      LOCKING:
1242  *      None.
1243  */
1244 void ata_eh_freeze_port(struct ata_port *ap)
1245 {
1246         unsigned long flags;
1247
1248         if (!ap->ops->error_handler)
1249                 return;
1250
1251         spin_lock_irqsave(ap->lock, flags);
1252         __ata_port_freeze(ap);
1253         spin_unlock_irqrestore(ap->lock, flags);
1254 }
1255
1256 /**
1257  *      ata_port_thaw_port - EH helper to thaw port
1258  *      @ap: ATA port to thaw
1259  *
1260  *      Thaw frozen port @ap.
1261  *
1262  *      LOCKING:
1263  *      None.
1264  */
1265 void ata_eh_thaw_port(struct ata_port *ap)
1266 {
1267         unsigned long flags;
1268
1269         if (!ap->ops->error_handler)
1270                 return;
1271
1272         spin_lock_irqsave(ap->lock, flags);
1273
1274         ap->pflags &= ~ATA_PFLAG_FROZEN;
1275
1276         if (ap->ops->thaw)
1277                 ap->ops->thaw(ap);
1278
1279         spin_unlock_irqrestore(ap->lock, flags);
1280
1281         DPRINTK("ata%u port thawed\n", ap->print_id);
1282 }
1283
1284 static void ata_eh_scsidone(struct scsi_cmnd *scmd)
1285 {
1286         /* nada */
1287 }
1288
1289 static void __ata_eh_qc_complete(struct ata_queued_cmd *qc)
1290 {
1291         struct ata_port *ap = qc->ap;
1292         struct scsi_cmnd *scmd = qc->scsicmd;
1293         unsigned long flags;
1294
1295         spin_lock_irqsave(ap->lock, flags);
1296         qc->scsidone = ata_eh_scsidone;
1297         __ata_qc_complete(qc);
1298         WARN_ON(ata_tag_valid(qc->tag));
1299         spin_unlock_irqrestore(ap->lock, flags);
1300
1301         scsi_eh_finish_cmd(scmd, &ap->eh_done_q);
1302 }
1303
1304 /**
1305  *      ata_eh_qc_complete - Complete an active ATA command from EH
1306  *      @qc: Command to complete
1307  *
1308  *      Indicate to the mid and upper layers that an ATA command has
1309  *      completed.  To be used from EH.
1310  */
1311 void ata_eh_qc_complete(struct ata_queued_cmd *qc)
1312 {
1313         struct scsi_cmnd *scmd = qc->scsicmd;
1314         scmd->retries = scmd->allowed;
1315         __ata_eh_qc_complete(qc);
1316 }
1317
1318 /**
1319  *      ata_eh_qc_retry - Tell midlayer to retry an ATA command after EH
1320  *      @qc: Command to retry
1321  *
1322  *      Indicate to the mid and upper layers that an ATA command
1323  *      should be retried.  To be used from EH.
1324  *
1325  *      SCSI midlayer limits the number of retries to scmd->allowed.
1326  *      scmd->allowed is incremented for commands which get retried
1327  *      due to unrelated failures (qc->err_mask is zero).
1328  */
1329 void ata_eh_qc_retry(struct ata_queued_cmd *qc)
1330 {
1331         struct scsi_cmnd *scmd = qc->scsicmd;
1332         if (!qc->err_mask)
1333                 scmd->allowed++;
1334         __ata_eh_qc_complete(qc);
1335 }
1336
1337 /**
1338  *      ata_dev_disable - disable ATA device
1339  *      @dev: ATA device to disable
1340  *
1341  *      Disable @dev.
1342  *
1343  *      Locking:
1344  *      EH context.
1345  */
1346 void ata_dev_disable(struct ata_device *dev)
1347 {
1348         if (!ata_dev_enabled(dev))
1349                 return;
1350
1351         if (ata_msg_drv(dev->link->ap))
1352                 ata_dev_warn(dev, "disabled\n");
1353         ata_acpi_on_disable(dev);
1354         ata_down_xfermask_limit(dev, ATA_DNXFER_FORCE_PIO0 | ATA_DNXFER_QUIET);
1355         dev->class++;
1356
1357         /* From now till the next successful probe, ering is used to
1358          * track probe failures.  Clear accumulated device error info.
1359          */
1360         ata_ering_clear(&dev->ering);
1361 }
1362
1363 /**
1364  *      ata_eh_detach_dev - detach ATA device
1365  *      @dev: ATA device to detach
1366  *
1367  *      Detach @dev.
1368  *
1369  *      LOCKING:
1370  *      None.
1371  */
1372 void ata_eh_detach_dev(struct ata_device *dev)
1373 {
1374         struct ata_link *link = dev->link;
1375         struct ata_port *ap = link->ap;
1376         struct ata_eh_context *ehc = &link->eh_context;
1377         unsigned long flags;
1378
1379         ata_dev_disable(dev);
1380
1381         spin_lock_irqsave(ap->lock, flags);
1382
1383         dev->flags &= ~ATA_DFLAG_DETACH;
1384
1385         if (ata_scsi_offline_dev(dev)) {
1386                 dev->flags |= ATA_DFLAG_DETACHED;
1387                 ap->pflags |= ATA_PFLAG_SCSI_HOTPLUG;
1388         }
1389
1390         /* clear per-dev EH info */
1391         ata_eh_clear_action(link, dev, &link->eh_info, ATA_EH_PERDEV_MASK);
1392         ata_eh_clear_action(link, dev, &link->eh_context.i, ATA_EH_PERDEV_MASK);
1393         ehc->saved_xfer_mode[dev->devno] = 0;
1394         ehc->saved_ncq_enabled &= ~(1 << dev->devno);
1395
1396         spin_unlock_irqrestore(ap->lock, flags);
1397 }
1398
1399 /**
1400  *      ata_eh_about_to_do - about to perform eh_action
1401  *      @link: target ATA link
1402  *      @dev: target ATA dev for per-dev action (can be NULL)
1403  *      @action: action about to be performed
1404  *
1405  *      Called just before performing EH actions to clear related bits
1406  *      in @link->eh_info such that eh actions are not unnecessarily
1407  *      repeated.
1408  *
1409  *      LOCKING:
1410  *      None.
1411  */
1412 void ata_eh_about_to_do(struct ata_link *link, struct ata_device *dev,
1413                         unsigned int action)
1414 {
1415         struct ata_port *ap = link->ap;
1416         struct ata_eh_info *ehi = &link->eh_info;
1417         struct ata_eh_context *ehc = &link->eh_context;
1418         unsigned long flags;
1419
1420         spin_lock_irqsave(ap->lock, flags);
1421
1422         ata_eh_clear_action(link, dev, ehi, action);
1423
1424         /* About to take EH action, set RECOVERED.  Ignore actions on
1425          * slave links as master will do them again.
1426          */
1427         if (!(ehc->i.flags & ATA_EHI_QUIET) && link != ap->slave_link)
1428                 ap->pflags |= ATA_PFLAG_RECOVERED;
1429
1430         spin_unlock_irqrestore(ap->lock, flags);
1431 }
1432
1433 /**
1434  *      ata_eh_done - EH action complete
1435 *       @ap: target ATA port
1436  *      @dev: target ATA dev for per-dev action (can be NULL)
1437  *      @action: action just completed
1438  *
1439  *      Called right after performing EH actions to clear related bits
1440  *      in @link->eh_context.
1441  *
1442  *      LOCKING:
1443  *      None.
1444  */
1445 void ata_eh_done(struct ata_link *link, struct ata_device *dev,
1446                  unsigned int action)
1447 {
1448         struct ata_eh_context *ehc = &link->eh_context;
1449
1450         ata_eh_clear_action(link, dev, &ehc->i, action);
1451 }
1452
1453 /**
1454  *      ata_err_string - convert err_mask to descriptive string
1455  *      @err_mask: error mask to convert to string
1456  *
1457  *      Convert @err_mask to descriptive string.  Errors are
1458  *      prioritized according to severity and only the most severe
1459  *      error is reported.
1460  *
1461  *      LOCKING:
1462  *      None.
1463  *
1464  *      RETURNS:
1465  *      Descriptive string for @err_mask
1466  */
1467 static const char *ata_err_string(unsigned int err_mask)
1468 {
1469         if (err_mask & AC_ERR_HOST_BUS)
1470                 return "host bus error";
1471         if (err_mask & AC_ERR_ATA_BUS)
1472                 return "ATA bus error";
1473         if (err_mask & AC_ERR_TIMEOUT)
1474                 return "timeout";
1475         if (err_mask & AC_ERR_HSM)
1476                 return "HSM violation";
1477         if (err_mask & AC_ERR_SYSTEM)
1478                 return "internal error";
1479         if (err_mask & AC_ERR_MEDIA)
1480                 return "media error";
1481         if (err_mask & AC_ERR_INVALID)
1482                 return "invalid argument";
1483         if (err_mask & AC_ERR_DEV)
1484                 return "device error";
1485         return "unknown error";
1486 }
1487
1488 /**
1489  *      ata_read_log_page - read a specific log page
1490  *      @dev: target device
1491  *      @log: log to read
1492  *      @page: page to read
1493  *      @buf: buffer to store read page
1494  *      @sectors: number of sectors to read
1495  *
1496  *      Read log page using READ_LOG_EXT command.
1497  *
1498  *      LOCKING:
1499  *      Kernel thread context (may sleep).
1500  *
1501  *      RETURNS:
1502  *      0 on success, AC_ERR_* mask otherwise.
1503  */
1504 unsigned int ata_read_log_page(struct ata_device *dev, u8 log,
1505                                u8 page, void *buf, unsigned int sectors)
1506 {
1507         struct ata_taskfile tf;
1508         unsigned int err_mask;
1509
1510         DPRINTK("read log page - log 0x%x, page 0x%x\n", log, page);
1511
1512         ata_tf_init(dev, &tf);
1513         tf.command = ATA_CMD_READ_LOG_EXT;
1514         tf.lbal = log;
1515         tf.lbam = page;
1516         tf.nsect = sectors;
1517         tf.hob_nsect = sectors >> 8;
1518         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_LBA48 | ATA_TFLAG_DEVICE;
1519         tf.protocol = ATA_PROT_PIO;
1520
1521         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_FROM_DEVICE,
1522                                      buf, sectors * ATA_SECT_SIZE, 0);
1523
1524         DPRINTK("EXIT, err_mask=%x\n", err_mask);
1525         return err_mask;
1526 }
1527
1528 /**
1529  *      ata_eh_read_log_10h - Read log page 10h for NCQ error details
1530  *      @dev: Device to read log page 10h from
1531  *      @tag: Resulting tag of the failed command
1532  *      @tf: Resulting taskfile registers of the failed command
1533  *
1534  *      Read log page 10h to obtain NCQ error details and clear error
1535  *      condition.
1536  *
1537  *      LOCKING:
1538  *      Kernel thread context (may sleep).
1539  *
1540  *      RETURNS:
1541  *      0 on success, -errno otherwise.
1542  */
1543 static int ata_eh_read_log_10h(struct ata_device *dev,
1544                                int *tag, struct ata_taskfile *tf)
1545 {
1546         u8 *buf = dev->link->ap->sector_buf;
1547         unsigned int err_mask;
1548         u8 csum;
1549         int i;
1550
1551         err_mask = ata_read_log_page(dev, ATA_LOG_SATA_NCQ, 0, buf, 1);
1552         if (err_mask)
1553                 return -EIO;
1554
1555         csum = 0;
1556         for (i = 0; i < ATA_SECT_SIZE; i++)
1557                 csum += buf[i];
1558         if (csum)
1559                 ata_dev_warn(dev, "invalid checksum 0x%x on log page 10h\n",
1560                              csum);
1561
1562         if (buf[0] & 0x80)
1563                 return -ENOENT;
1564
1565         *tag = buf[0] & 0x1f;
1566
1567         tf->command = buf[2];
1568         tf->feature = buf[3];
1569         tf->lbal = buf[4];
1570         tf->lbam = buf[5];
1571         tf->lbah = buf[6];
1572         tf->device = buf[7];
1573         tf->hob_lbal = buf[8];
1574         tf->hob_lbam = buf[9];
1575         tf->hob_lbah = buf[10];
1576         tf->nsect = buf[12];
1577         tf->hob_nsect = buf[13];
1578
1579         return 0;
1580 }
1581
1582 /**
1583  *      atapi_eh_tur - perform ATAPI TEST_UNIT_READY
1584  *      @dev: target ATAPI device
1585  *      @r_sense_key: out parameter for sense_key
1586  *
1587  *      Perform ATAPI TEST_UNIT_READY.
1588  *
1589  *      LOCKING:
1590  *      EH context (may sleep).
1591  *
1592  *      RETURNS:
1593  *      0 on success, AC_ERR_* mask on failure.
1594  */
1595 unsigned int atapi_eh_tur(struct ata_device *dev, u8 *r_sense_key)
1596 {
1597         u8 cdb[ATAPI_CDB_LEN] = { TEST_UNIT_READY, 0, 0, 0, 0, 0 };
1598         struct ata_taskfile tf;
1599         unsigned int err_mask;
1600
1601         ata_tf_init(dev, &tf);
1602
1603         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_DEVICE;
1604         tf.command = ATA_CMD_PACKET;
1605         tf.protocol = ATAPI_PROT_NODATA;
1606
1607         err_mask = ata_exec_internal(dev, &tf, cdb, DMA_NONE, NULL, 0, 0);
1608         if (err_mask == AC_ERR_DEV)
1609                 *r_sense_key = tf.feature >> 4;
1610         return err_mask;
1611 }
1612
1613 /**
1614  *      atapi_eh_request_sense - perform ATAPI REQUEST_SENSE
1615  *      @dev: device to perform REQUEST_SENSE to
1616  *      @sense_buf: result sense data buffer (SCSI_SENSE_BUFFERSIZE bytes long)
1617  *      @dfl_sense_key: default sense key to use
1618  *
1619  *      Perform ATAPI REQUEST_SENSE after the device reported CHECK
1620  *      SENSE.  This function is EH helper.
1621  *
1622  *      LOCKING:
1623  *      Kernel thread context (may sleep).
1624  *
1625  *      RETURNS:
1626  *      0 on success, AC_ERR_* mask on failure
1627  */
1628 unsigned int atapi_eh_request_sense(struct ata_device *dev,
1629                                            u8 *sense_buf, u8 dfl_sense_key)
1630 {
1631         u8 cdb[ATAPI_CDB_LEN] =
1632                 { REQUEST_SENSE, 0, 0, 0, SCSI_SENSE_BUFFERSIZE, 0 };
1633         struct ata_port *ap = dev->link->ap;
1634         struct ata_taskfile tf;
1635
1636         DPRINTK("ATAPI request sense\n");
1637
1638         /* FIXME: is this needed? */
1639         memset(sense_buf, 0, SCSI_SENSE_BUFFERSIZE);
1640
1641         /* initialize sense_buf with the error register,
1642          * for the case where they are -not- overwritten
1643          */
1644         sense_buf[0] = 0x70;
1645         sense_buf[2] = dfl_sense_key;
1646
1647         /* some devices time out if garbage left in tf */
1648         ata_tf_init(dev, &tf);
1649
1650         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_DEVICE;
1651         tf.command = ATA_CMD_PACKET;
1652
1653         /* is it pointless to prefer PIO for "safety reasons"? */
1654         if (ap->flags & ATA_FLAG_PIO_DMA) {
1655                 tf.protocol = ATAPI_PROT_DMA;
1656                 tf.feature |= ATAPI_PKT_DMA;
1657         } else {
1658                 tf.protocol = ATAPI_PROT_PIO;
1659                 tf.lbam = SCSI_SENSE_BUFFERSIZE;
1660                 tf.lbah = 0;
1661         }
1662
1663         return ata_exec_internal(dev, &tf, cdb, DMA_FROM_DEVICE,
1664                                  sense_buf, SCSI_SENSE_BUFFERSIZE, 0);
1665 }
1666
1667 /**
1668  *      ata_eh_analyze_serror - analyze SError for a failed port
1669  *      @link: ATA link to analyze SError for
1670  *
1671  *      Analyze SError if available and further determine cause of
1672  *      failure.
1673  *
1674  *      LOCKING:
1675  *      None.
1676  */
1677 static void ata_eh_analyze_serror(struct ata_link *link)
1678 {
1679         struct ata_eh_context *ehc = &link->eh_context;
1680         u32 serror = ehc->i.serror;
1681         unsigned int err_mask = 0, action = 0;
1682         u32 hotplug_mask;
1683
1684         if (serror & (SERR_PERSISTENT | SERR_DATA)) {
1685                 err_mask |= AC_ERR_ATA_BUS;
1686                 action |= ATA_EH_RESET;
1687         }
1688         if (serror & SERR_PROTOCOL) {
1689                 err_mask |= AC_ERR_HSM;
1690                 action |= ATA_EH_RESET;
1691         }
1692         if (serror & SERR_INTERNAL) {
1693                 err_mask |= AC_ERR_SYSTEM;
1694                 action |= ATA_EH_RESET;
1695         }
1696
1697         /* Determine whether a hotplug event has occurred.  Both
1698          * SError.N/X are considered hotplug events for enabled or
1699          * host links.  For disabled PMP links, only N bit is
1700          * considered as X bit is left at 1 for link plugging.
1701          */
1702         if (link->lpm_policy > ATA_LPM_MAX_POWER)
1703                 hotplug_mask = 0;       /* hotplug doesn't work w/ LPM */
1704         else if (!(link->flags & ATA_LFLAG_DISABLED) || ata_is_host_link(link))
1705                 hotplug_mask = SERR_PHYRDY_CHG | SERR_DEV_XCHG;
1706         else
1707                 hotplug_mask = SERR_PHYRDY_CHG;
1708
1709         if (serror & hotplug_mask)
1710                 ata_ehi_hotplugged(&ehc->i);
1711
1712         ehc->i.err_mask |= err_mask;
1713         ehc->i.action |= action;
1714 }
1715
1716 /**
1717  *      ata_eh_analyze_ncq_error - analyze NCQ error
1718  *      @link: ATA link to analyze NCQ error for
1719  *
1720  *      Read log page 10h, determine the offending qc and acquire
1721  *      error status TF.  For NCQ device errors, all LLDDs have to do
1722  *      is setting AC_ERR_DEV in ehi->err_mask.  This function takes
1723  *      care of the rest.
1724  *
1725  *      LOCKING:
1726  *      Kernel thread context (may sleep).
1727  */
1728 void ata_eh_analyze_ncq_error(struct ata_link *link)
1729 {
1730         struct ata_port *ap = link->ap;
1731         struct ata_eh_context *ehc = &link->eh_context;
1732         struct ata_device *dev = link->device;
1733         struct ata_queued_cmd *qc;
1734         struct ata_taskfile tf;
1735         int tag, rc;
1736
1737         /* if frozen, we can't do much */
1738         if (ap->pflags & ATA_PFLAG_FROZEN)
1739                 return;
1740
1741         /* is it NCQ device error? */
1742         if (!link->sactive || !(ehc->i.err_mask & AC_ERR_DEV))
1743                 return;
1744
1745         /* has LLDD analyzed already? */
1746         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
1747                 qc = __ata_qc_from_tag(ap, tag);
1748
1749                 if (!(qc->flags & ATA_QCFLAG_FAILED))
1750                         continue;
1751
1752                 if (qc->err_mask)
1753                         return;
1754         }
1755
1756         /* okay, this error is ours */
1757         memset(&tf, 0, sizeof(tf));
1758         rc = ata_eh_read_log_10h(dev, &tag, &tf);
1759         if (rc) {
1760                 ata_link_err(link, "failed to read log page 10h (errno=%d)\n",
1761                              rc);
1762                 return;
1763         }
1764
1765         if (!(link->sactive & (1 << tag))) {
1766                 ata_link_err(link, "log page 10h reported inactive tag %d\n",
1767                              tag);
1768                 return;
1769         }
1770
1771         /* we've got the perpetrator, condemn it */
1772         qc = __ata_qc_from_tag(ap, tag);
1773         memcpy(&qc->result_tf, &tf, sizeof(tf));
1774         qc->result_tf.flags = ATA_TFLAG_ISADDR | ATA_TFLAG_LBA | ATA_TFLAG_LBA48;
1775         qc->err_mask |= AC_ERR_DEV | AC_ERR_NCQ;
1776         ehc->i.err_mask &= ~AC_ERR_DEV;
1777 }
1778
1779 /**
1780  *      ata_eh_analyze_tf - analyze taskfile of a failed qc
1781  *      @qc: qc to analyze
1782  *      @tf: Taskfile registers to analyze
1783  *
1784  *      Analyze taskfile of @qc and further determine cause of
1785  *      failure.  This function also requests ATAPI sense data if
1786  *      available.
1787  *
1788  *      LOCKING:
1789  *      Kernel thread context (may sleep).
1790  *
1791  *      RETURNS:
1792  *      Determined recovery action
1793  */
1794 static unsigned int ata_eh_analyze_tf(struct ata_queued_cmd *qc,
1795                                       const struct ata_taskfile *tf)
1796 {
1797         unsigned int tmp, action = 0;
1798         u8 stat = tf->command, err = tf->feature;
1799
1800         if ((stat & (ATA_BUSY | ATA_DRQ | ATA_DRDY)) != ATA_DRDY) {
1801                 qc->err_mask |= AC_ERR_HSM;
1802                 return ATA_EH_RESET;
1803         }
1804
1805         if (stat & (ATA_ERR | ATA_DF))
1806                 qc->err_mask |= AC_ERR_DEV;
1807         else
1808                 return 0;
1809
1810         switch (qc->dev->class) {
1811         case ATA_DEV_ATA:
1812                 if (err & ATA_ICRC)
1813                         qc->err_mask |= AC_ERR_ATA_BUS;
1814                 if (err & ATA_UNC)
1815                         qc->err_mask |= AC_ERR_MEDIA;
1816                 if (err & ATA_IDNF)
1817                         qc->err_mask |= AC_ERR_INVALID;
1818                 break;
1819
1820         case ATA_DEV_ATAPI:
1821                 if (!(qc->ap->pflags & ATA_PFLAG_FROZEN)) {
1822                         tmp = atapi_eh_request_sense(qc->dev,
1823                                                 qc->scsicmd->sense_buffer,
1824                                                 qc->result_tf.feature >> 4);
1825                         if (!tmp) {
1826                                 /* ATA_QCFLAG_SENSE_VALID is used to
1827                                  * tell atapi_qc_complete() that sense
1828                                  * data is already valid.
1829                                  *
1830                                  * TODO: interpret sense data and set
1831                                  * appropriate err_mask.
1832                                  */
1833                                 qc->flags |= ATA_QCFLAG_SENSE_VALID;
1834                         } else
1835                                 qc->err_mask |= tmp;
1836                 }
1837         }
1838
1839         if (qc->err_mask & (AC_ERR_HSM | AC_ERR_TIMEOUT | AC_ERR_ATA_BUS))
1840                 action |= ATA_EH_RESET;
1841
1842         return action;
1843 }
1844
1845 static int ata_eh_categorize_error(unsigned int eflags, unsigned int err_mask,
1846                                    int *xfer_ok)
1847 {
1848         int base = 0;
1849
1850         if (!(eflags & ATA_EFLAG_DUBIOUS_XFER))
1851                 *xfer_ok = 1;
1852
1853         if (!*xfer_ok)
1854                 base = ATA_ECAT_DUBIOUS_NONE;
1855
1856         if (err_mask & AC_ERR_ATA_BUS)
1857                 return base + ATA_ECAT_ATA_BUS;
1858
1859         if (err_mask & AC_ERR_TIMEOUT)
1860                 return base + ATA_ECAT_TOUT_HSM;
1861
1862         if (eflags & ATA_EFLAG_IS_IO) {
1863                 if (err_mask & AC_ERR_HSM)
1864                         return base + ATA_ECAT_TOUT_HSM;
1865                 if ((err_mask &
1866                      (AC_ERR_DEV|AC_ERR_MEDIA|AC_ERR_INVALID)) == AC_ERR_DEV)
1867                         return base + ATA_ECAT_UNK_DEV;
1868         }
1869
1870         return 0;
1871 }
1872
1873 struct speed_down_verdict_arg {
1874         u64 since;
1875         int xfer_ok;
1876         int nr_errors[ATA_ECAT_NR];
1877 };
1878
1879 static int speed_down_verdict_cb(struct ata_ering_entry *ent, void *void_arg)
1880 {
1881         struct speed_down_verdict_arg *arg = void_arg;
1882         int cat;
1883
1884         if ((ent->eflags & ATA_EFLAG_OLD_ER) || (ent->timestamp < arg->since))
1885                 return -1;
1886
1887         cat = ata_eh_categorize_error(ent->eflags, ent->err_mask,
1888                                       &arg->xfer_ok);
1889         arg->nr_errors[cat]++;
1890
1891         return 0;
1892 }
1893
1894 /**
1895  *      ata_eh_speed_down_verdict - Determine speed down verdict
1896  *      @dev: Device of interest
1897  *
1898  *      This function examines error ring of @dev and determines
1899  *      whether NCQ needs to be turned off, transfer speed should be
1900  *      stepped down, or falling back to PIO is necessary.
1901  *
1902  *      ECAT_ATA_BUS    : ATA_BUS error for any command
1903  *
1904  *      ECAT_TOUT_HSM   : TIMEOUT for any command or HSM violation for
1905  *                        IO commands
1906  *
1907  *      ECAT_UNK_DEV    : Unknown DEV error for IO commands
1908  *
1909  *      ECAT_DUBIOUS_*  : Identical to above three but occurred while
1910  *                        data transfer hasn't been verified.
1911  *
1912  *      Verdicts are
1913  *
1914  *      NCQ_OFF         : Turn off NCQ.
1915  *
1916  *      SPEED_DOWN      : Speed down transfer speed but don't fall back
1917  *                        to PIO.
1918  *
1919  *      FALLBACK_TO_PIO : Fall back to PIO.
1920  *
1921  *      Even if multiple verdicts are returned, only one action is
1922  *      taken per error.  An action triggered by non-DUBIOUS errors
1923  *      clears ering, while one triggered by DUBIOUS_* errors doesn't.
1924  *      This is to expedite speed down decisions right after device is
1925  *      initially configured.
1926  *
1927  *      The followings are speed down rules.  #1 and #2 deal with
1928  *      DUBIOUS errors.
1929  *
1930  *      1. If more than one DUBIOUS_ATA_BUS or DUBIOUS_TOUT_HSM errors
1931  *         occurred during last 5 mins, SPEED_DOWN and FALLBACK_TO_PIO.
1932  *
1933  *      2. If more than one DUBIOUS_TOUT_HSM or DUBIOUS_UNK_DEV errors
1934  *         occurred during last 5 mins, NCQ_OFF.
1935  *
1936  *      3. If more than 8 ATA_BUS, TOUT_HSM or UNK_DEV errors
1937  *         occurred during last 5 mins, FALLBACK_TO_PIO
1938  *
1939  *      4. If more than 3 TOUT_HSM or UNK_DEV errors occurred
1940  *         during last 10 mins, NCQ_OFF.
1941  *
1942  *      5. If more than 3 ATA_BUS or TOUT_HSM errors, or more than 6
1943  *         UNK_DEV errors occurred during last 10 mins, SPEED_DOWN.
1944  *
1945  *      LOCKING:
1946  *      Inherited from caller.
1947  *
1948  *      RETURNS:
1949  *      OR of ATA_EH_SPDN_* flags.
1950  */
1951 static unsigned int ata_eh_speed_down_verdict(struct ata_device *dev)
1952 {
1953         const u64 j5mins = 5LLU * 60 * HZ, j10mins = 10LLU * 60 * HZ;
1954         u64 j64 = get_jiffies_64();
1955         struct speed_down_verdict_arg arg;
1956         unsigned int verdict = 0;
1957
1958         /* scan past 5 mins of error history */
1959         memset(&arg, 0, sizeof(arg));
1960         arg.since = j64 - min(j64, j5mins);
1961         ata_ering_map(&dev->ering, speed_down_verdict_cb, &arg);
1962
1963         if (arg.nr_errors[ATA_ECAT_DUBIOUS_ATA_BUS] +
1964             arg.nr_errors[ATA_ECAT_DUBIOUS_TOUT_HSM] > 1)
1965                 verdict |= ATA_EH_SPDN_SPEED_DOWN |
1966                         ATA_EH_SPDN_FALLBACK_TO_PIO | ATA_EH_SPDN_KEEP_ERRORS;
1967
1968         if (arg.nr_errors[ATA_ECAT_DUBIOUS_TOUT_HSM] +
1969             arg.nr_errors[ATA_ECAT_DUBIOUS_UNK_DEV] > 1)
1970                 verdict |= ATA_EH_SPDN_NCQ_OFF | ATA_EH_SPDN_KEEP_ERRORS;
1971
1972         if (arg.nr_errors[ATA_ECAT_ATA_BUS] +
1973             arg.nr_errors[ATA_ECAT_TOUT_HSM] +
1974             arg.nr_errors[ATA_ECAT_UNK_DEV] > 6)
1975                 verdict |= ATA_EH_SPDN_FALLBACK_TO_PIO;
1976
1977         /* scan past 10 mins of error history */
1978         memset(&arg, 0, sizeof(arg));
1979         arg.since = j64 - min(j64, j10mins);
1980         ata_ering_map(&dev->ering, speed_down_verdict_cb, &arg);
1981
1982         if (arg.nr_errors[ATA_ECAT_TOUT_HSM] +
1983             arg.nr_errors[ATA_ECAT_UNK_DEV] > 3)
1984                 verdict |= ATA_EH_SPDN_NCQ_OFF;
1985
1986         if (arg.nr_errors[ATA_ECAT_ATA_BUS] +
1987             arg.nr_errors[ATA_ECAT_TOUT_HSM] > 3 ||
1988             arg.nr_errors[ATA_ECAT_UNK_DEV] > 6)
1989                 verdict |= ATA_EH_SPDN_SPEED_DOWN;
1990
1991         return verdict;
1992 }
1993
1994 /**
1995  *      ata_eh_speed_down - record error and speed down if necessary
1996  *      @dev: Failed device
1997  *      @eflags: mask of ATA_EFLAG_* flags
1998  *      @err_mask: err_mask of the error
1999  *
2000  *      Record error and examine error history to determine whether
2001  *      adjusting transmission speed is necessary.  It also sets
2002  *      transmission limits appropriately if such adjustment is
2003  *      necessary.
2004  *
2005  *      LOCKING:
2006  *      Kernel thread context (may sleep).
2007  *
2008  *      RETURNS:
2009  *      Determined recovery action.
2010  */
2011 static unsigned int ata_eh_speed_down(struct ata_device *dev,
2012                                 unsigned int eflags, unsigned int err_mask)
2013 {
2014         struct ata_link *link = ata_dev_phys_link(dev);
2015         int xfer_ok = 0;
2016         unsigned int verdict;
2017         unsigned int action = 0;
2018
2019         /* don't bother if Cat-0 error */
2020         if (ata_eh_categorize_error(eflags, err_mask, &xfer_ok) == 0)
2021                 return 0;
2022
2023         /* record error and determine whether speed down is necessary */
2024         ata_ering_record(&dev->ering, eflags, err_mask);
2025         verdict = ata_eh_speed_down_verdict(dev);
2026
2027         /* turn off NCQ? */
2028         if ((verdict & ATA_EH_SPDN_NCQ_OFF) &&
2029             (dev->flags & (ATA_DFLAG_PIO | ATA_DFLAG_NCQ |
2030                            ATA_DFLAG_NCQ_OFF)) == ATA_DFLAG_NCQ) {
2031                 dev->flags |= ATA_DFLAG_NCQ_OFF;
2032                 ata_dev_warn(dev, "NCQ disabled due to excessive errors\n");
2033                 goto done;
2034         }
2035
2036         /* speed down? */
2037         if (verdict & ATA_EH_SPDN_SPEED_DOWN) {
2038                 /* speed down SATA link speed if possible */
2039                 if (sata_down_spd_limit(link, 0) == 0) {
2040                         action |= ATA_EH_RESET;
2041                         goto done;
2042                 }
2043
2044                 /* lower transfer mode */
2045                 if (dev->spdn_cnt < 2) {
2046                         static const int dma_dnxfer_sel[] =
2047                                 { ATA_DNXFER_DMA, ATA_DNXFER_40C };
2048                         static const int pio_dnxfer_sel[] =
2049                                 { ATA_DNXFER_PIO, ATA_DNXFER_FORCE_PIO0 };
2050                         int sel;
2051
2052                         if (dev->xfer_shift != ATA_SHIFT_PIO)
2053                                 sel = dma_dnxfer_sel[dev->spdn_cnt];
2054                         else
2055                                 sel = pio_dnxfer_sel[dev->spdn_cnt];
2056
2057                         dev->spdn_cnt++;
2058
2059                         if (ata_down_xfermask_limit(dev, sel) == 0) {
2060                                 action |= ATA_EH_RESET;
2061                                 goto done;
2062                         }
2063                 }
2064         }
2065
2066         /* Fall back to PIO?  Slowing down to PIO is meaningless for
2067          * SATA ATA devices.  Consider it only for PATA and SATAPI.
2068          */
2069         if ((verdict & ATA_EH_SPDN_FALLBACK_TO_PIO) && (dev->spdn_cnt >= 2) &&
2070             (link->ap->cbl != ATA_CBL_SATA || dev->class == ATA_DEV_ATAPI) &&
2071             (dev->xfer_shift != ATA_SHIFT_PIO)) {
2072                 if (ata_down_xfermask_limit(dev, ATA_DNXFER_FORCE_PIO) == 0) {
2073                         dev->spdn_cnt = 0;
2074                         action |= ATA_EH_RESET;
2075                         goto done;
2076                 }
2077         }
2078
2079         return 0;
2080  done:
2081         /* device has been slowed down, blow error history */
2082         if (!(verdict & ATA_EH_SPDN_KEEP_ERRORS))
2083                 ata_ering_clear(&dev->ering);
2084         return action;
2085 }
2086
2087 /**
2088  *      ata_eh_worth_retry - analyze error and decide whether to retry
2089  *      @qc: qc to possibly retry
2090  *
2091  *      Look at the cause of the error and decide if a retry
2092  *      might be useful or not.  We don't want to retry media errors
2093  *      because the drive itself has probably already taken 10-30 seconds
2094  *      doing its own internal retries before reporting the failure.
2095  */
2096 static inline int ata_eh_worth_retry(struct ata_queued_cmd *qc)
2097 {
2098         if (qc->err_mask & AC_ERR_MEDIA)
2099                 return 0;       /* don't retry media errors */
2100         if (qc->flags & ATA_QCFLAG_IO)
2101                 return 1;       /* otherwise retry anything from fs stack */
2102         if (qc->err_mask & AC_ERR_INVALID)
2103                 return 0;       /* don't retry these */
2104         return qc->err_mask != AC_ERR_DEV;  /* retry if not dev error */
2105 }
2106
2107 /**
2108  *      ata_eh_link_autopsy - analyze error and determine recovery action
2109  *      @link: host link to perform autopsy on
2110  *
2111  *      Analyze why @link failed and determine which recovery actions
2112  *      are needed.  This function also sets more detailed AC_ERR_*
2113  *      values and fills sense data for ATAPI CHECK SENSE.
2114  *
2115  *      LOCKING:
2116  *      Kernel thread context (may sleep).
2117  */
2118 static void ata_eh_link_autopsy(struct ata_link *link)
2119 {
2120         struct ata_port *ap = link->ap;
2121         struct ata_eh_context *ehc = &link->eh_context;
2122         struct ata_device *dev;
2123         unsigned int all_err_mask = 0, eflags = 0;
2124         int tag;
2125         u32 serror;
2126         int rc;
2127
2128         DPRINTK("ENTER\n");
2129
2130         if (ehc->i.flags & ATA_EHI_NO_AUTOPSY)
2131                 return;
2132
2133         /* obtain and analyze SError */
2134         rc = sata_scr_read(link, SCR_ERROR, &serror);
2135         if (rc == 0) {
2136                 ehc->i.serror |= serror;
2137                 ata_eh_analyze_serror(link);
2138         } else if (rc != -EOPNOTSUPP) {
2139                 /* SError read failed, force reset and probing */
2140                 ehc->i.probe_mask |= ATA_ALL_DEVICES;
2141                 ehc->i.action |= ATA_EH_RESET;
2142                 ehc->i.err_mask |= AC_ERR_OTHER;
2143         }
2144
2145         /* analyze NCQ failure */
2146         ata_eh_analyze_ncq_error(link);
2147
2148         /* any real error trumps AC_ERR_OTHER */
2149         if (ehc->i.err_mask & ~AC_ERR_OTHER)
2150                 ehc->i.err_mask &= ~AC_ERR_OTHER;
2151
2152         all_err_mask |= ehc->i.err_mask;
2153
2154         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2155                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2156
2157                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2158                     ata_dev_phys_link(qc->dev) != link)
2159                         continue;
2160
2161                 /* inherit upper level err_mask */
2162                 qc->err_mask |= ehc->i.err_mask;
2163
2164                 /* analyze TF */
2165                 ehc->i.action |= ata_eh_analyze_tf(qc, &qc->result_tf);
2166
2167                 /* DEV errors are probably spurious in case of ATA_BUS error */
2168                 if (qc->err_mask & AC_ERR_ATA_BUS)
2169                         qc->err_mask &= ~(AC_ERR_DEV | AC_ERR_MEDIA |
2170                                           AC_ERR_INVALID);
2171
2172                 /* any real error trumps unknown error */
2173                 if (qc->err_mask & ~AC_ERR_OTHER)
2174                         qc->err_mask &= ~AC_ERR_OTHER;
2175
2176                 /* SENSE_VALID trumps dev/unknown error and revalidation */
2177                 if (qc->flags & ATA_QCFLAG_SENSE_VALID)
2178                         qc->err_mask &= ~(AC_ERR_DEV | AC_ERR_OTHER);
2179
2180                 /* determine whether the command is worth retrying */
2181                 if (ata_eh_worth_retry(qc))
2182                         qc->flags |= ATA_QCFLAG_RETRY;
2183
2184                 /* accumulate error info */
2185                 ehc->i.dev = qc->dev;
2186                 all_err_mask |= qc->err_mask;
2187                 if (qc->flags & ATA_QCFLAG_IO)
2188                         eflags |= ATA_EFLAG_IS_IO;
2189         }
2190
2191         /* enforce default EH actions */
2192         if (ap->pflags & ATA_PFLAG_FROZEN ||
2193             all_err_mask & (AC_ERR_HSM | AC_ERR_TIMEOUT))
2194                 ehc->i.action |= ATA_EH_RESET;
2195         else if (((eflags & ATA_EFLAG_IS_IO) && all_err_mask) ||
2196                  (!(eflags & ATA_EFLAG_IS_IO) && (all_err_mask & ~AC_ERR_DEV)))
2197                 ehc->i.action |= ATA_EH_REVALIDATE;
2198
2199         /* If we have offending qcs and the associated failed device,
2200          * perform per-dev EH action only on the offending device.
2201          */
2202         if (ehc->i.dev) {
2203                 ehc->i.dev_action[ehc->i.dev->devno] |=
2204                         ehc->i.action & ATA_EH_PERDEV_MASK;
2205                 ehc->i.action &= ~ATA_EH_PERDEV_MASK;
2206         }
2207
2208         /* propagate timeout to host link */
2209         if ((all_err_mask & AC_ERR_TIMEOUT) && !ata_is_host_link(link))
2210                 ap->link.eh_context.i.err_mask |= AC_ERR_TIMEOUT;
2211
2212         /* record error and consider speeding down */
2213         dev = ehc->i.dev;
2214         if (!dev && ((ata_link_max_devices(link) == 1 &&
2215                       ata_dev_enabled(link->device))))
2216             dev = link->device;
2217
2218         if (dev) {
2219                 if (dev->flags & ATA_DFLAG_DUBIOUS_XFER)
2220                         eflags |= ATA_EFLAG_DUBIOUS_XFER;
2221                 ehc->i.action |= ata_eh_speed_down(dev, eflags, all_err_mask);
2222         }
2223
2224         DPRINTK("EXIT\n");
2225 }
2226
2227 /**
2228  *      ata_eh_autopsy - analyze error and determine recovery action
2229  *      @ap: host port to perform autopsy on
2230  *
2231  *      Analyze all links of @ap and determine why they failed and
2232  *      which recovery actions are needed.
2233  *
2234  *      LOCKING:
2235  *      Kernel thread context (may sleep).
2236  */
2237 void ata_eh_autopsy(struct ata_port *ap)
2238 {
2239         struct ata_link *link;
2240
2241         ata_for_each_link(link, ap, EDGE)
2242                 ata_eh_link_autopsy(link);
2243
2244         /* Handle the frigging slave link.  Autopsy is done similarly
2245          * but actions and flags are transferred over to the master
2246          * link and handled from there.
2247          */
2248         if (ap->slave_link) {
2249                 struct ata_eh_context *mehc = &ap->link.eh_context;
2250                 struct ata_eh_context *sehc = &ap->slave_link->eh_context;
2251
2252                 /* transfer control flags from master to slave */
2253                 sehc->i.flags |= mehc->i.flags & ATA_EHI_TO_SLAVE_MASK;
2254
2255                 /* perform autopsy on the slave link */
2256                 ata_eh_link_autopsy(ap->slave_link);
2257
2258                 /* transfer actions from slave to master and clear slave */
2259                 ata_eh_about_to_do(ap->slave_link, NULL, ATA_EH_ALL_ACTIONS);
2260                 mehc->i.action          |= sehc->i.action;
2261                 mehc->i.dev_action[1]   |= sehc->i.dev_action[1];
2262                 mehc->i.flags           |= sehc->i.flags;
2263                 ata_eh_done(ap->slave_link, NULL, ATA_EH_ALL_ACTIONS);
2264         }
2265
2266         /* Autopsy of fanout ports can affect host link autopsy.
2267          * Perform host link autopsy last.
2268          */
2269         if (sata_pmp_attached(ap))
2270                 ata_eh_link_autopsy(&ap->link);
2271 }
2272
2273 /**
2274  *      ata_get_cmd_descript - get description for ATA command
2275  *      @command: ATA command code to get description for
2276  *
2277  *      Return a textual description of the given command, or NULL if the
2278  *      command is not known.
2279  *
2280  *      LOCKING:
2281  *      None
2282  */
2283 const char *ata_get_cmd_descript(u8 command)
2284 {
2285 #ifdef CONFIG_ATA_VERBOSE_ERROR
2286         static const struct
2287         {
2288                 u8 command;
2289                 const char *text;
2290         } cmd_descr[] = {
2291                 { ATA_CMD_DEV_RESET,            "DEVICE RESET" },
2292                 { ATA_CMD_CHK_POWER,            "CHECK POWER MODE" },
2293                 { ATA_CMD_STANDBY,              "STANDBY" },
2294                 { ATA_CMD_IDLE,                 "IDLE" },
2295                 { ATA_CMD_EDD,                  "EXECUTE DEVICE DIAGNOSTIC" },
2296                 { ATA_CMD_DOWNLOAD_MICRO,       "DOWNLOAD MICROCODE" },
2297                 { ATA_CMD_DOWNLOAD_MICRO_DMA,   "DOWNLOAD MICROCODE DMA" },
2298                 { ATA_CMD_NOP,                  "NOP" },
2299                 { ATA_CMD_FLUSH,                "FLUSH CACHE" },
2300                 { ATA_CMD_FLUSH_EXT,            "FLUSH CACHE EXT" },
2301                 { ATA_CMD_ID_ATA,               "IDENTIFY DEVICE" },
2302                 { ATA_CMD_ID_ATAPI,             "IDENTIFY PACKET DEVICE" },
2303                 { ATA_CMD_SERVICE,              "SERVICE" },
2304                 { ATA_CMD_READ,                 "READ DMA" },
2305                 { ATA_CMD_READ_EXT,             "READ DMA EXT" },
2306                 { ATA_CMD_READ_QUEUED,          "READ DMA QUEUED" },
2307                 { ATA_CMD_READ_STREAM_EXT,      "READ STREAM EXT" },
2308                 { ATA_CMD_READ_STREAM_DMA_EXT,  "READ STREAM DMA EXT" },
2309                 { ATA_CMD_WRITE,                "WRITE DMA" },
2310                 { ATA_CMD_WRITE_EXT,            "WRITE DMA EXT" },
2311                 { ATA_CMD_WRITE_QUEUED,         "WRITE DMA QUEUED EXT" },
2312                 { ATA_CMD_WRITE_STREAM_EXT,     "WRITE STREAM EXT" },
2313                 { ATA_CMD_WRITE_STREAM_DMA_EXT, "WRITE STREAM DMA EXT" },
2314                 { ATA_CMD_WRITE_FUA_EXT,        "WRITE DMA FUA EXT" },
2315                 { ATA_CMD_WRITE_QUEUED_FUA_EXT, "WRITE DMA QUEUED FUA EXT" },
2316                 { ATA_CMD_FPDMA_READ,           "READ FPDMA QUEUED" },
2317                 { ATA_CMD_FPDMA_WRITE,          "WRITE FPDMA QUEUED" },
2318                 { ATA_CMD_FPDMA_SEND,           "SEND FPDMA QUEUED" },
2319                 { ATA_CMD_FPDMA_RECV,           "RECEIVE FPDMA QUEUED" },
2320                 { ATA_CMD_PIO_READ,             "READ SECTOR(S)" },
2321                 { ATA_CMD_PIO_READ_EXT,         "READ SECTOR(S) EXT" },
2322                 { ATA_CMD_PIO_WRITE,            "WRITE SECTOR(S)" },
2323                 { ATA_CMD_PIO_WRITE_EXT,        "WRITE SECTOR(S) EXT" },
2324                 { ATA_CMD_READ_MULTI,           "READ MULTIPLE" },
2325                 { ATA_CMD_READ_MULTI_EXT,       "READ MULTIPLE EXT" },
2326                 { ATA_CMD_WRITE_MULTI,          "WRITE MULTIPLE" },
2327                 { ATA_CMD_WRITE_MULTI_EXT,      "WRITE MULTIPLE EXT" },
2328                 { ATA_CMD_WRITE_MULTI_FUA_EXT,  "WRITE MULTIPLE FUA EXT" },
2329                 { ATA_CMD_SET_FEATURES,         "SET FEATURES" },
2330                 { ATA_CMD_SET_MULTI,            "SET MULTIPLE MODE" },
2331                 { ATA_CMD_VERIFY,               "READ VERIFY SECTOR(S)" },
2332                 { ATA_CMD_VERIFY_EXT,           "READ VERIFY SECTOR(S) EXT" },
2333                 { ATA_CMD_WRITE_UNCORR_EXT,     "WRITE UNCORRECTABLE EXT" },
2334                 { ATA_CMD_STANDBYNOW1,          "STANDBY IMMEDIATE" },
2335                 { ATA_CMD_IDLEIMMEDIATE,        "IDLE IMMEDIATE" },
2336                 { ATA_CMD_SLEEP,                "SLEEP" },
2337                 { ATA_CMD_INIT_DEV_PARAMS,      "INITIALIZE DEVICE PARAMETERS" },
2338                 { ATA_CMD_READ_NATIVE_MAX,      "READ NATIVE MAX ADDRESS" },
2339                 { ATA_CMD_READ_NATIVE_MAX_EXT,  "READ NATIVE MAX ADDRESS EXT" },
2340                 { ATA_CMD_SET_MAX,              "SET MAX ADDRESS" },
2341                 { ATA_CMD_SET_MAX_EXT,          "SET MAX ADDRESS EXT" },
2342                 { ATA_CMD_READ_LOG_EXT,         "READ LOG EXT" },
2343                 { ATA_CMD_WRITE_LOG_EXT,        "WRITE LOG EXT" },
2344                 { ATA_CMD_READ_LOG_DMA_EXT,     "READ LOG DMA EXT" },
2345                 { ATA_CMD_WRITE_LOG_DMA_EXT,    "WRITE LOG DMA EXT" },
2346                 { ATA_CMD_TRUSTED_NONDATA,      "TRUSTED NON-DATA" },
2347                 { ATA_CMD_TRUSTED_RCV,          "TRUSTED RECEIVE" },
2348                 { ATA_CMD_TRUSTED_RCV_DMA,      "TRUSTED RECEIVE DMA" },
2349                 { ATA_CMD_TRUSTED_SND,          "TRUSTED SEND" },
2350                 { ATA_CMD_TRUSTED_SND_DMA,      "TRUSTED SEND DMA" },
2351                 { ATA_CMD_PMP_READ,             "READ BUFFER" },
2352                 { ATA_CMD_PMP_READ_DMA,         "READ BUFFER DMA" },
2353                 { ATA_CMD_PMP_WRITE,            "WRITE BUFFER" },
2354                 { ATA_CMD_PMP_WRITE_DMA,        "WRITE BUFFER DMA" },
2355                 { ATA_CMD_CONF_OVERLAY,         "DEVICE CONFIGURATION OVERLAY" },
2356                 { ATA_CMD_SEC_SET_PASS,         "SECURITY SET PASSWORD" },
2357                 { ATA_CMD_SEC_UNLOCK,           "SECURITY UNLOCK" },
2358                 { ATA_CMD_SEC_ERASE_PREP,       "SECURITY ERASE PREPARE" },
2359                 { ATA_CMD_SEC_ERASE_UNIT,       "SECURITY ERASE UNIT" },
2360                 { ATA_CMD_SEC_FREEZE_LOCK,      "SECURITY FREEZE LOCK" },
2361                 { ATA_CMD_SEC_DISABLE_PASS,     "SECURITY DISABLE PASSWORD" },
2362                 { ATA_CMD_CONFIG_STREAM,        "CONFIGURE STREAM" },
2363                 { ATA_CMD_SMART,                "SMART" },
2364                 { ATA_CMD_MEDIA_LOCK,           "DOOR LOCK" },
2365                 { ATA_CMD_MEDIA_UNLOCK,         "DOOR UNLOCK" },
2366                 { ATA_CMD_DSM,                  "DATA SET MANAGEMENT" },
2367                 { ATA_CMD_CHK_MED_CRD_TYP,      "CHECK MEDIA CARD TYPE" },
2368                 { ATA_CMD_CFA_REQ_EXT_ERR,      "CFA REQUEST EXTENDED ERROR" },
2369                 { ATA_CMD_CFA_WRITE_NE,         "CFA WRITE SECTORS WITHOUT ERASE" },
2370                 { ATA_CMD_CFA_TRANS_SECT,       "CFA TRANSLATE SECTOR" },
2371                 { ATA_CMD_CFA_ERASE,            "CFA ERASE SECTORS" },
2372                 { ATA_CMD_CFA_WRITE_MULT_NE,    "CFA WRITE MULTIPLE WITHOUT ERASE" },
2373                 { ATA_CMD_REQ_SENSE_DATA,       "REQUEST SENSE DATA EXT" },
2374                 { ATA_CMD_SANITIZE_DEVICE,      "SANITIZE DEVICE" },
2375                 { ATA_CMD_READ_LONG,            "READ LONG (with retries)" },
2376                 { ATA_CMD_READ_LONG_ONCE,       "READ LONG (without retries)" },
2377                 { ATA_CMD_WRITE_LONG,           "WRITE LONG (with retries)" },
2378                 { ATA_CMD_WRITE_LONG_ONCE,      "WRITE LONG (without retries)" },
2379                 { ATA_CMD_RESTORE,              "RECALIBRATE" },
2380                 { 0,                            NULL } /* terminate list */
2381         };
2382
2383         unsigned int i;
2384         for (i = 0; cmd_descr[i].text; i++)
2385                 if (cmd_descr[i].command == command)
2386                         return cmd_descr[i].text;
2387 #endif
2388
2389         return NULL;
2390 }
2391
2392 /**
2393  *      ata_eh_link_report - report error handling to user
2394  *      @link: ATA link EH is going on
2395  *
2396  *      Report EH to user.
2397  *
2398  *      LOCKING:
2399  *      None.
2400  */
2401 static void ata_eh_link_report(struct ata_link *link)
2402 {
2403         struct ata_port *ap = link->ap;
2404         struct ata_eh_context *ehc = &link->eh_context;
2405         const char *frozen, *desc;
2406         char tries_buf[6] = "";
2407         int tag, nr_failed = 0;
2408
2409         if (ehc->i.flags & ATA_EHI_QUIET)
2410                 return;
2411
2412         desc = NULL;
2413         if (ehc->i.desc[0] != '\0')
2414                 desc = ehc->i.desc;
2415
2416         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2417                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2418
2419                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2420                     ata_dev_phys_link(qc->dev) != link ||
2421                     ((qc->flags & ATA_QCFLAG_QUIET) &&
2422                      qc->err_mask == AC_ERR_DEV))
2423                         continue;
2424                 if (qc->flags & ATA_QCFLAG_SENSE_VALID && !qc->err_mask)
2425                         continue;
2426
2427                 nr_failed++;
2428         }
2429
2430         if (!nr_failed && !ehc->i.err_mask)
2431                 return;
2432
2433         frozen = "";
2434         if (ap->pflags & ATA_PFLAG_FROZEN)
2435                 frozen = " frozen";
2436
2437         if (ap->eh_tries < ATA_EH_MAX_TRIES)
2438                 snprintf(tries_buf, sizeof(tries_buf), " t%d",
2439                          ap->eh_tries);
2440
2441         if (ehc->i.dev) {
2442                 ata_dev_err(ehc->i.dev, "exception Emask 0x%x "
2443                             "SAct 0x%x SErr 0x%x action 0x%x%s%s\n",
2444                             ehc->i.err_mask, link->sactive, ehc->i.serror,
2445                             ehc->i.action, frozen, tries_buf);
2446                 if (desc)
2447                         ata_dev_err(ehc->i.dev, "%s\n", desc);
2448         } else {
2449                 ata_link_err(link, "exception Emask 0x%x "
2450                              "SAct 0x%x SErr 0x%x action 0x%x%s%s\n",
2451                              ehc->i.err_mask, link->sactive, ehc->i.serror,
2452                              ehc->i.action, frozen, tries_buf);
2453                 if (desc)
2454                         ata_link_err(link, "%s\n", desc);
2455         }
2456
2457 #ifdef CONFIG_ATA_VERBOSE_ERROR
2458         if (ehc->i.serror)
2459                 ata_link_err(link,
2460                   "SError: { %s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s}\n",
2461                   ehc->i.serror & SERR_DATA_RECOVERED ? "RecovData " : "",
2462                   ehc->i.serror & SERR_COMM_RECOVERED ? "RecovComm " : "",
2463                   ehc->i.serror & SERR_DATA ? "UnrecovData " : "",
2464                   ehc->i.serror & SERR_PERSISTENT ? "Persist " : "",
2465                   ehc->i.serror & SERR_PROTOCOL ? "Proto " : "",
2466                   ehc->i.serror & SERR_INTERNAL ? "HostInt " : "",
2467                   ehc->i.serror & SERR_PHYRDY_CHG ? "PHYRdyChg " : "",
2468                   ehc->i.serror & SERR_PHY_INT_ERR ? "PHYInt " : "",
2469                   ehc->i.serror & SERR_COMM_WAKE ? "CommWake " : "",
2470                   ehc->i.serror & SERR_10B_8B_ERR ? "10B8B " : "",
2471                   ehc->i.serror & SERR_DISPARITY ? "Dispar " : "",
2472                   ehc->i.serror & SERR_CRC ? "BadCRC " : "",
2473                   ehc->i.serror & SERR_HANDSHAKE ? "Handshk " : "",
2474                   ehc->i.serror & SERR_LINK_SEQ_ERR ? "LinkSeq " : "",
2475                   ehc->i.serror & SERR_TRANS_ST_ERROR ? "TrStaTrns " : "",
2476                   ehc->i.serror & SERR_UNRECOG_FIS ? "UnrecFIS " : "",
2477                   ehc->i.serror & SERR_DEV_XCHG ? "DevExch " : "");
2478 #endif
2479
2480         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2481                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2482                 struct ata_taskfile *cmd = &qc->tf, *res = &qc->result_tf;
2483                 const u8 *cdb = qc->cdb;
2484                 char data_buf[20] = "";
2485                 char cdb_buf[70] = "";
2486
2487                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2488                     ata_dev_phys_link(qc->dev) != link || !qc->err_mask)
2489                         continue;
2490
2491                 if (qc->dma_dir != DMA_NONE) {
2492                         static const char *dma_str[] = {
2493                                 [DMA_BIDIRECTIONAL]     = "bidi",
2494                                 [DMA_TO_DEVICE]         = "out",
2495                                 [DMA_FROM_DEVICE]       = "in",
2496                         };
2497                         static const char *prot_str[] = {
2498                                 [ATA_PROT_PIO]          = "pio",
2499                                 [ATA_PROT_DMA]          = "dma",
2500                                 [ATA_PROT_NCQ]          = "ncq",
2501                                 [ATAPI_PROT_PIO]        = "pio",
2502                                 [ATAPI_PROT_DMA]        = "dma",
2503                         };
2504
2505                         snprintf(data_buf, sizeof(data_buf), " %s %u %s",
2506                                  prot_str[qc->tf.protocol], qc->nbytes,
2507                                  dma_str[qc->dma_dir]);
2508                 }
2509
2510                 if (ata_is_atapi(qc->tf.protocol)) {
2511                         if (qc->scsicmd)
2512                                 scsi_print_command(qc->scsicmd);
2513                         else
2514                                 snprintf(cdb_buf, sizeof(cdb_buf),
2515                                  "cdb %02x %02x %02x %02x %02x %02x %02x %02x  "
2516                                  "%02x %02x %02x %02x %02x %02x %02x %02x\n         ",
2517                                  cdb[0], cdb[1], cdb[2], cdb[3],
2518                                  cdb[4], cdb[5], cdb[6], cdb[7],
2519                                  cdb[8], cdb[9], cdb[10], cdb[11],
2520                                  cdb[12], cdb[13], cdb[14], cdb[15]);
2521                 } else {
2522                         const char *descr = ata_get_cmd_descript(cmd->command);
2523                         if (descr)
2524                                 ata_dev_err(qc->dev, "failed command: %s\n",
2525                                             descr);
2526                 }
2527
2528                 ata_dev_err(qc->dev,
2529                         "cmd %02x/%02x:%02x:%02x:%02x:%02x/%02x:%02x:%02x:%02x:%02x/%02x "
2530                         "tag %d%s\n         %s"
2531                         "res %02x/%02x:%02x:%02x:%02x:%02x/%02x:%02x:%02x:%02x:%02x/%02x "
2532                         "Emask 0x%x (%s)%s\n",
2533                         cmd->command, cmd->feature, cmd->nsect,
2534                         cmd->lbal, cmd->lbam, cmd->lbah,
2535                         cmd->hob_feature, cmd->hob_nsect,
2536                         cmd->hob_lbal, cmd->hob_lbam, cmd->hob_lbah,
2537                         cmd->device, qc->tag, data_buf, cdb_buf,
2538                         res->command, res->feature, res->nsect,
2539                         res->lbal, res->lbam, res->lbah,
2540                         res->hob_feature, res->hob_nsect,
2541                         res->hob_lbal, res->hob_lbam, res->hob_lbah,
2542                         res->device, qc->err_mask, ata_err_string(qc->err_mask),
2543                         qc->err_mask & AC_ERR_NCQ ? " <F>" : "");
2544
2545 #ifdef CONFIG_ATA_VERBOSE_ERROR
2546                 if (res->command & (ATA_BUSY | ATA_DRDY | ATA_DF | ATA_DRQ |
2547                                     ATA_ERR)) {
2548                         if (res->command & ATA_BUSY)
2549                                 ata_dev_err(qc->dev, "status: { Busy }\n");
2550                         else
2551                                 ata_dev_err(qc->dev, "status: { %s%s%s%s}\n",
2552                                   res->command & ATA_DRDY ? "DRDY " : "",
2553                                   res->command & ATA_DF ? "DF " : "",
2554                                   res->command & ATA_DRQ ? "DRQ " : "",
2555                                   res->command & ATA_ERR ? "ERR " : "");
2556                 }
2557
2558                 if (cmd->command != ATA_CMD_PACKET &&
2559                     (res->feature & (ATA_ICRC | ATA_UNC | ATA_IDNF |
2560                                      ATA_ABORTED)))
2561                         ata_dev_err(qc->dev, "error: { %s%s%s%s}\n",
2562                           res->feature & ATA_ICRC ? "ICRC " : "",
2563                           res->feature & ATA_UNC ? "UNC " : "",
2564                           res->feature & ATA_IDNF ? "IDNF " : "",
2565                           res->feature & ATA_ABORTED ? "ABRT " : "");
2566 #endif
2567         }
2568 }
2569
2570 /**
2571  *      ata_eh_report - report error handling to user
2572  *      @ap: ATA port to report EH about
2573  *
2574  *      Report EH to user.
2575  *
2576  *      LOCKING:
2577  *      None.
2578  */
2579 void ata_eh_report(struct ata_port *ap)
2580 {
2581         struct ata_link *link;
2582
2583         ata_for_each_link(link, ap, HOST_FIRST)
2584                 ata_eh_link_report(link);
2585 }
2586
2587 static int ata_do_reset(struct ata_link *link, ata_reset_fn_t reset,
2588                         unsigned int *classes, unsigned long deadline,
2589                         bool clear_classes)
2590 {
2591         struct ata_device *dev;
2592
2593         if (clear_classes)
2594                 ata_for_each_dev(dev, link, ALL)
2595                         classes[dev->devno] = ATA_DEV_UNKNOWN;
2596
2597         return reset(link, classes, deadline);
2598 }
2599
2600 static int ata_eh_followup_srst_needed(struct ata_link *link, int rc)
2601 {
2602         if ((link->flags & ATA_LFLAG_NO_SRST) || ata_link_offline(link))
2603                 return 0;
2604         if (rc == -EAGAIN)
2605                 return 1;
2606         if (sata_pmp_supported(link->ap) && ata_is_host_link(link))
2607                 return 1;
2608         return 0;
2609 }
2610
2611 int ata_eh_reset(struct ata_link *link, int classify,
2612                  ata_prereset_fn_t prereset, ata_reset_fn_t softreset,
2613                  ata_reset_fn_t hardreset, ata_postreset_fn_t postreset)
2614 {
2615         struct ata_port *ap = link->ap;
2616         struct ata_link *slave = ap->slave_link;
2617         struct ata_eh_context *ehc = &link->eh_context;
2618         struct ata_eh_context *sehc = slave ? &slave->eh_context : NULL;
2619         unsigned int *classes = ehc->classes;
2620         unsigned int lflags = link->flags;
2621         int verbose = !(ehc->i.flags & ATA_EHI_QUIET);
2622         int max_tries = 0, try = 0;
2623         struct ata_link *failed_link;
2624         struct ata_device *dev;
2625         unsigned long deadline, now;
2626         ata_reset_fn_t reset;
2627         unsigned long flags;
2628         u32 sstatus;
2629         int nr_unknown, rc;
2630
2631         /*
2632          * Prepare to reset
2633          */
2634         while (ata_eh_reset_timeouts[max_tries] != ULONG_MAX)
2635                 max_tries++;
2636         if (link->flags & ATA_LFLAG_RST_ONCE)
2637                 max_tries = 1;
2638         if (link->flags & ATA_LFLAG_NO_HRST)
2639                 hardreset = NULL;
2640         if (link->flags & ATA_LFLAG_NO_SRST)
2641                 softreset = NULL;
2642
2643         /* make sure each reset attempt is at least COOL_DOWN apart */
2644         if (ehc->i.flags & ATA_EHI_DID_RESET) {
2645                 now = jiffies;
2646                 WARN_ON(time_after(ehc->last_reset, now));
2647                 deadline = ata_deadline(ehc->last_reset,
2648                                         ATA_EH_RESET_COOL_DOWN);
2649                 if (time_before(now, deadline))
2650                         schedule_timeout_uninterruptible(deadline - now);
2651         }
2652
2653         spin_lock_irqsave(ap->lock, flags);
2654         ap->pflags |= ATA_PFLAG_RESETTING;
2655         spin_unlock_irqrestore(ap->lock, flags);
2656
2657         ata_eh_about_to_do(link, NULL, ATA_EH_RESET);
2658
2659         ata_for_each_dev(dev, link, ALL) {
2660                 /* If we issue an SRST then an ATA drive (not ATAPI)
2661                  * may change configuration and be in PIO0 timing. If
2662                  * we do a hard reset (or are coming from power on)
2663                  * this is true for ATA or ATAPI. Until we've set a
2664                  * suitable controller mode we should not touch the
2665                  * bus as we may be talking too fast.
2666                  */
2667                 dev->pio_mode = XFER_PIO_0;
2668                 dev->dma_mode = 0xff;
2669
2670                 /* If the controller has a pio mode setup function
2671                  * then use it to set the chipset to rights. Don't
2672                  * touch the DMA setup as that will be dealt with when
2673                  * configuring devices.
2674                  */
2675                 if (ap->ops->set_piomode)
2676                         ap->ops->set_piomode(ap, dev);
2677         }
2678
2679         /* prefer hardreset */
2680         reset = NULL;
2681         ehc->i.action &= ~ATA_EH_RESET;
2682         if (hardreset) {
2683                 reset = hardreset;
2684                 ehc->i.action |= ATA_EH_HARDRESET;
2685         } else if (softreset) {
2686                 reset = softreset;
2687                 ehc->i.action |= ATA_EH_SOFTRESET;
2688         }
2689
2690         if (prereset) {
2691                 unsigned long deadline = ata_deadline(jiffies,
2692                                                       ATA_EH_PRERESET_TIMEOUT);
2693
2694                 if (slave) {
2695                         sehc->i.action &= ~ATA_EH_RESET;
2696                         sehc->i.action |= ehc->i.action;
2697                 }
2698
2699                 rc = prereset(link, deadline);
2700
2701                 /* If present, do prereset on slave link too.  Reset
2702                  * is skipped iff both master and slave links report
2703                  * -ENOENT or clear ATA_EH_RESET.
2704                  */
2705                 if (slave && (rc == 0 || rc == -ENOENT)) {
2706                         int tmp;
2707
2708                         tmp = prereset(slave, deadline);
2709                         if (tmp != -ENOENT)
2710                                 rc = tmp;
2711
2712                         ehc->i.action |= sehc->i.action;
2713                 }
2714
2715                 if (rc) {
2716                         if (rc == -ENOENT) {
2717                                 ata_link_dbg(link, "port disabled--ignoring\n");
2718                                 ehc->i.action &= ~ATA_EH_RESET;
2719
2720                                 ata_for_each_dev(dev, link, ALL)
2721                                         classes[dev->devno] = ATA_DEV_NONE;
2722
2723                                 rc = 0;
2724                         } else
2725                                 ata_link_err(link,
2726                                              "prereset failed (errno=%d)\n",
2727                                              rc);
2728                         goto out;
2729                 }
2730
2731                 /* prereset() might have cleared ATA_EH_RESET.  If so,
2732                  * bang classes, thaw and return.
2733                  */
2734                 if (reset && !(ehc->i.action & ATA_EH_RESET)) {
2735                         ata_for_each_dev(dev, link, ALL)
2736                                 classes[dev->devno] = ATA_DEV_NONE;
2737                         if ((ap->pflags & ATA_PFLAG_FROZEN) &&
2738                             ata_is_host_link(link))
2739                                 ata_eh_thaw_port(ap);
2740                         rc = 0;
2741                         goto out;
2742                 }
2743         }
2744
2745  retry:
2746         /*
2747          * Perform reset
2748          */
2749         if (ata_is_host_link(link))
2750                 ata_eh_freeze_port(ap);
2751
2752         deadline = ata_deadline(jiffies, ata_eh_reset_timeouts[try++]);
2753
2754         if (reset) {
2755                 if (verbose)
2756                         ata_link_info(link, "%s resetting link\n",
2757                                       reset == softreset ? "soft" : "hard");
2758
2759                 /* mark that this EH session started with reset */
2760                 ehc->last_reset = jiffies;
2761                 if (reset == hardreset)
2762                         ehc->i.flags |= ATA_EHI_DID_HARDRESET;
2763                 else
2764                         ehc->i.flags |= ATA_EHI_DID_SOFTRESET;
2765
2766                 rc = ata_do_reset(link, reset, classes, deadline, true);
2767                 if (rc && rc != -EAGAIN) {
2768                         failed_link = link;
2769                         goto fail;
2770                 }
2771
2772                 /* hardreset slave link if existent */
2773                 if (slave && reset == hardreset) {
2774                         int tmp;
2775
2776                         if (verbose)
2777                                 ata_link_info(slave, "hard resetting link\n");
2778
2779                         ata_eh_about_to_do(slave, NULL, ATA_EH_RESET);
2780                         tmp = ata_do_reset(slave, reset, classes, deadline,
2781                                            false);
2782                         switch (tmp) {
2783                         case -EAGAIN:
2784                                 rc = -EAGAIN;
2785                         case 0:
2786                                 break;
2787                         default:
2788                                 failed_link = slave;
2789                                 rc = tmp;
2790                                 goto fail;
2791                         }
2792                 }
2793
2794                 /* perform follow-up SRST if necessary */
2795                 if (reset == hardreset &&
2796                     ata_eh_followup_srst_needed(link, rc)) {
2797                         reset = softreset;
2798
2799                         if (!reset) {
2800                                 ata_link_err(link,
2801              "follow-up softreset required but no softreset available\n");
2802                                 failed_link = link;
2803                                 rc = -EINVAL;
2804                                 goto fail;
2805                         }
2806
2807                         ata_eh_about_to_do(link, NULL, ATA_EH_RESET);
2808                         rc = ata_do_reset(link, reset, classes, deadline, true);
2809                         if (rc) {
2810                                 failed_link = link;
2811                                 goto fail;
2812                         }
2813                 }
2814         } else {
2815                 if (verbose)
2816                         ata_link_info(link,
2817         "no reset method available, skipping reset\n");
2818                 if (!(lflags & ATA_LFLAG_ASSUME_CLASS))
2819                         lflags |= ATA_LFLAG_ASSUME_ATA;
2820         }
2821
2822         /*
2823          * Post-reset processing
2824          */
2825         ata_for_each_dev(dev, link, ALL) {
2826                 /* After the reset, the device state is PIO 0 and the
2827                  * controller state is undefined.  Reset also wakes up
2828                  * drives from sleeping mode.
2829                  */
2830                 dev->pio_mode = XFER_PIO_0;
2831                 dev->flags &= ~ATA_DFLAG_SLEEPING;
2832
2833                 if (ata_phys_link_offline(ata_dev_phys_link(dev)))
2834                         continue;
2835
2836                 /* apply class override */
2837                 if (lflags & ATA_LFLAG_ASSUME_ATA)
2838                         classes[dev->devno] = ATA_DEV_ATA;
2839                 else if (lflags & ATA_LFLAG_ASSUME_SEMB)
2840                         classes[dev->devno] = ATA_DEV_SEMB_UNSUP;
2841         }
2842
2843         /* record current link speed */
2844         if (sata_scr_read(link, SCR_STATUS, &sstatus) == 0)
2845                 link->sata_spd = (sstatus >> 4) & 0xf;
2846         if (slave && sata_scr_read(slave, SCR_STATUS, &sstatus) == 0)
2847                 slave->sata_spd = (sstatus >> 4) & 0xf;
2848
2849         /* thaw the port */
2850         if (ata_is_host_link(link))
2851                 ata_eh_thaw_port(ap);
2852
2853         /* postreset() should clear hardware SError.  Although SError
2854          * is cleared during link resume, clearing SError here is
2855          * necessary as some PHYs raise hotplug events after SRST.
2856          * This introduces race condition where hotplug occurs between
2857          * reset and here.  This race is mediated by cross checking
2858          * link onlineness and classification result later.
2859          */
2860         if (postreset) {
2861                 postreset(link, classes);
2862                 if (slave)
2863                         postreset(slave, classes);
2864         }
2865
2866         /*
2867          * Some controllers can't be frozen very well and may set spurious
2868          * error conditions during reset.  Clear accumulated error
2869          * information and re-thaw the port if frozen.  As reset is the
2870          * final recovery action and we cross check link onlineness against
2871          * device classification later, no hotplug event is lost by this.
2872          */
2873         spin_lock_irqsave(link->ap->lock, flags);
2874         memset(&link->eh_info, 0, sizeof(link->eh_info));
2875         if (slave)
2876                 memset(&slave->eh_info, 0, sizeof(link->eh_info));
2877         ap->pflags &= ~ATA_PFLAG_EH_PENDING;
2878         spin_unlock_irqrestore(link->ap->lock, flags);
2879
2880         if (ap->pflags & ATA_PFLAG_FROZEN)
2881                 ata_eh_thaw_port(ap);
2882
2883         /*
2884          * Make sure onlineness and classification result correspond.
2885          * Hotplug could have happened during reset and some
2886          * controllers fail to wait while a drive is spinning up after
2887          * being hotplugged causing misdetection.  By cross checking
2888          * link on/offlineness and classification result, those
2889          * conditions can be reliably detected and retried.
2890          */
2891         nr_unknown = 0;
2892         ata_for_each_dev(dev, link, ALL) {
2893                 if (ata_phys_link_online(ata_dev_phys_link(dev))) {
2894                         if (classes[dev->devno] == ATA_DEV_UNKNOWN) {
2895                                 ata_dev_dbg(dev, "link online but device misclassified\n");
2896                                 classes[dev->devno] = ATA_DEV_NONE;
2897                                 nr_unknown++;
2898                         }
2899                 } else if (ata_phys_link_offline(ata_dev_phys_link(dev))) {
2900                         if (ata_class_enabled(classes[dev->devno]))
2901                                 ata_dev_dbg(dev,
2902                                             "link offline, clearing class %d to NONE\n",
2903                                             classes[dev->devno]);
2904                         classes[dev->devno] = ATA_DEV_NONE;
2905                 } else if (classes[dev->devno] == ATA_DEV_UNKNOWN) {
2906                         ata_dev_dbg(dev,
2907                                     "link status unknown, clearing UNKNOWN to NONE\n");
2908                         classes[dev->devno] = ATA_DEV_NONE;
2909                 }
2910         }
2911
2912         if (classify && nr_unknown) {
2913                 if (try < max_tries) {
2914                         ata_link_warn(link,
2915                                       "link online but %d devices misclassified, retrying\n",
2916                                       nr_unknown);
2917                         failed_link = link;
2918                         rc = -EAGAIN;
2919                         goto fail;
2920                 }
2921                 ata_link_warn(link,
2922                               "link online but %d devices misclassified, "
2923                               "device detection might fail\n", nr_unknown);
2924         }
2925
2926         /* reset successful, schedule revalidation */
2927         ata_eh_done(link, NULL, ATA_EH_RESET);
2928         if (slave)
2929                 ata_eh_done(slave, NULL, ATA_EH_RESET);
2930         ehc->last_reset = jiffies;              /* update to completion time */
2931         ehc->i.action |= ATA_EH_REVALIDATE;
2932         link->lpm_policy = ATA_LPM_UNKNOWN;     /* reset LPM state */
2933
2934         rc = 0;
2935  out:
2936         /* clear hotplug flag */
2937         ehc->i.flags &= ~ATA_EHI_HOTPLUGGED;
2938         if (slave)
2939                 sehc->i.flags &= ~ATA_EHI_HOTPLUGGED;
2940
2941         spin_lock_irqsave(ap->lock, flags);
2942         ap->pflags &= ~ATA_PFLAG_RESETTING;
2943         spin_unlock_irqrestore(ap->lock, flags);
2944
2945         return rc;
2946
2947  fail:
2948         /* if SCR isn't accessible on a fan-out port, PMP needs to be reset */
2949         if (!ata_is_host_link(link) &&
2950             sata_scr_read(link, SCR_STATUS, &sstatus))
2951                 rc = -ERESTART;
2952
2953         if (try >= max_tries) {
2954                 /*
2955                  * Thaw host port even if reset failed, so that the port
2956                  * can be retried on the next phy event.  This risks
2957                  * repeated EH runs but seems to be a better tradeoff than
2958                  * shutting down a port after a botched hotplug attempt.
2959                  */
2960                 if (ata_is_host_link(link))
2961                         ata_eh_thaw_port(ap);
2962                 goto out;
2963         }
2964
2965         now = jiffies;
2966         if (time_before(now, deadline)) {
2967                 unsigned long delta = deadline - now;
2968
2969                 ata_link_warn(failed_link,
2970                         "reset failed (errno=%d), retrying in %u secs\n",
2971                         rc, DIV_ROUND_UP(jiffies_to_msecs(delta), 1000));
2972
2973                 ata_eh_release(ap);
2974                 while (delta)
2975                         delta = schedule_timeout_uninterruptible(delta);
2976                 ata_eh_acquire(ap);
2977         }
2978
2979         /*
2980          * While disks spinup behind PMP, some controllers fail sending SRST.
2981          * They need to be reset - as well as the PMP - before retrying.
2982          */
2983         if (rc == -ERESTART) {
2984                 if (ata_is_host_link(link))
2985                         ata_eh_thaw_port(ap);
2986                 goto out;
2987         }
2988
2989         if (try == max_tries - 1) {
2990                 sata_down_spd_limit(link, 0);
2991                 if (slave)
2992                         sata_down_spd_limit(slave, 0);
2993         } else if (rc == -EPIPE)
2994                 sata_down_spd_limit(failed_link, 0);
2995
2996         if (hardreset)
2997                 reset = hardreset;
2998         goto retry;
2999 }
3000
3001 static inline void ata_eh_pull_park_action(struct ata_port *ap)
3002 {
3003         struct ata_link *link;
3004         struct ata_device *dev;
3005         unsigned long flags;
3006
3007         /*
3008          * This function can be thought of as an extended version of
3009          * ata_eh_about_to_do() specially crafted to accommodate the
3010          * requirements of ATA_EH_PARK handling. Since the EH thread
3011          * does not leave the do {} while () loop in ata_eh_recover as
3012          * long as the timeout for a park request to *one* device on
3013          * the port has not expired, and since we still want to pick
3014          * up park requests to other devices on the same port or
3015          * timeout updates for the same device, we have to pull
3016          * ATA_EH_PARK actions from eh_info into eh_context.i
3017          * ourselves at the beginning of each pass over the loop.
3018          *
3019          * Additionally, all write accesses to &ap->park_req_pending
3020          * through reinit_completion() (see below) or complete_all()
3021          * (see ata_scsi_park_store()) are protected by the host lock.
3022          * As a result we have that park_req_pending.done is zero on
3023          * exit from this function, i.e. when ATA_EH_PARK actions for
3024          * *all* devices on port ap have been pulled into the
3025          * respective eh_context structs. If, and only if,
3026          * park_req_pending.done is non-zero by the time we reach
3027          * wait_for_completion_timeout(), another ATA_EH_PARK action
3028          * has been scheduled for at least one of the devices on port
3029          * ap and we have to cycle over the do {} while () loop in
3030          * ata_eh_recover() again.
3031          */
3032
3033         spin_lock_irqsave(ap->lock, flags);
3034         reinit_completion(&ap->park_req_pending);
3035         ata_for_each_link(link, ap, EDGE) {
3036                 ata_for_each_dev(dev, link, ALL) {
3037                         struct ata_eh_info *ehi = &link->eh_info;
3038
3039                         link->eh_context.i.dev_action[dev->devno] |=
3040                                 ehi->dev_action[dev->devno] & ATA_EH_PARK;
3041                         ata_eh_clear_action(link, dev, ehi, ATA_EH_PARK);
3042                 }
3043         }
3044         spin_unlock_irqrestore(ap->lock, flags);
3045 }
3046
3047 static void ata_eh_park_issue_cmd(struct ata_device *dev, int park)
3048 {
3049         struct ata_eh_context *ehc = &dev->link->eh_context;
3050         struct ata_taskfile tf;
3051         unsigned int err_mask;
3052
3053         ata_tf_init(dev, &tf);
3054         if (park) {
3055                 ehc->unloaded_mask |= 1 << dev->devno;
3056                 tf.command = ATA_CMD_IDLEIMMEDIATE;
3057                 tf.feature = 0x44;
3058                 tf.lbal = 0x4c;
3059                 tf.lbam = 0x4e;
3060                 tf.lbah = 0x55;
3061         } else {
3062                 ehc->unloaded_mask &= ~(1 << dev->devno);
3063                 tf.command = ATA_CMD_CHK_POWER;
3064         }
3065
3066         tf.flags |= ATA_TFLAG_DEVICE | ATA_TFLAG_ISADDR;
3067         tf.protocol |= ATA_PROT_NODATA;
3068         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_NONE, NULL, 0, 0);
3069         if (park && (err_mask || tf.lbal != 0xc4)) {
3070                 ata_dev_err(dev, "head unload failed!\n");
3071                 ehc->unloaded_mask &= ~(1 << dev->devno);
3072         }
3073 }
3074
3075 static int ata_eh_revalidate_and_attach(struct ata_link *link,
3076                                         struct ata_device **r_failed_dev)
3077 {
3078         struct ata_port *ap = link->ap;
3079         struct ata_eh_context *ehc = &link->eh_context;
3080         struct ata_device *dev;
3081         unsigned int new_mask = 0;
3082         unsigned long flags;
3083         int rc = 0;
3084
3085         DPRINTK("ENTER\n");
3086
3087         /* For PATA drive side cable detection to work, IDENTIFY must
3088          * be done backwards such that PDIAG- is released by the slave
3089          * device before the master device is identified.
3090          */
3091         ata_for_each_dev(dev, link, ALL_REVERSE) {
3092                 unsigned int action = ata_eh_dev_action(dev);
3093                 unsigned int readid_flags = 0;
3094
3095                 if (ehc->i.flags & ATA_EHI_DID_RESET)
3096                         readid_flags |= ATA_READID_POSTRESET;
3097
3098                 if ((action & ATA_EH_REVALIDATE) && ata_dev_enabled(dev)) {
3099                         WARN_ON(dev->class == ATA_DEV_PMP);
3100
3101                         if (ata_phys_link_offline(ata_dev_phys_link(dev))) {
3102                                 rc = -EIO;
3103                                 goto err;
3104                         }
3105
3106                         ata_eh_about_to_do(link, dev, ATA_EH_REVALIDATE);
3107                         rc = ata_dev_revalidate(dev, ehc->classes[dev->devno],
3108                                                 readid_flags);
3109                         if (rc)
3110                                 goto err;
3111
3112                         ata_eh_done(link, dev, ATA_EH_REVALIDATE);
3113
3114                         /* Configuration may have changed, reconfigure
3115                          * transfer mode.
3116                          */
3117                         ehc->i.flags |= ATA_EHI_SETMODE;
3118
3119                         /* schedule the scsi_rescan_device() here */
3120                         schedule_work(&(ap->scsi_rescan_task));
3121                 } else if (dev->class == ATA_DEV_UNKNOWN &&
3122                            ehc->tries[dev->devno] &&
3123                            ata_class_enabled(ehc->classes[dev->devno])) {
3124                         /* Temporarily set dev->class, it will be
3125                          * permanently set once all configurations are
3126                          * complete.  This is necessary because new
3127                          * device configuration is done in two
3128                          * separate loops.
3129                          */
3130                         dev->class = ehc->classes[dev->devno];
3131
3132                         if (dev->class == ATA_DEV_PMP)
3133                                 rc = sata_pmp_attach(dev);
3134                         else
3135                                 rc = ata_dev_read_id(dev, &dev->class,
3136                                                      readid_flags, dev->id);
3137
3138                         /* read_id might have changed class, store and reset */
3139                         ehc->classes[dev->devno] = dev->class;
3140                         dev->class = ATA_DEV_UNKNOWN;
3141
3142                         switch (rc) {
3143                         case 0:
3144                                 /* clear error info accumulated during probe */
3145                                 ata_ering_clear(&dev->ering);
3146                                 new_mask |= 1 << dev->devno;
3147                                 break;
3148                         case -ENOENT:
3149                                 /* IDENTIFY was issued to non-existent
3150                                  * device.  No need to reset.  Just
3151                                  * thaw and ignore the device.
3152                                  */
3153                                 ata_eh_thaw_port(ap);
3154                                 break;
3155                         default:
3156                                 goto err;
3157                         }
3158                 }
3159         }
3160
3161         /* PDIAG- should have been released, ask cable type if post-reset */
3162         if ((ehc->i.flags & ATA_EHI_DID_RESET) && ata_is_host_link(link)) {
3163                 if (ap->ops->cable_detect)
3164                         ap->cbl = ap->ops->cable_detect(ap);
3165                 ata_force_cbl(ap);
3166         }
3167
3168         /* Configure new devices forward such that user doesn't see
3169          * device detection messages backwards.
3170          */
3171         ata_for_each_dev(dev, link, ALL) {
3172                 if (!(new_mask & (1 << dev->devno)))
3173                         continue;
3174
3175                 dev->class = ehc->classes[dev->devno];
3176
3177                 if (dev->class == ATA_DEV_PMP)
3178                         continue;
3179
3180                 ehc->i.flags |= ATA_EHI_PRINTINFO;
3181                 rc = ata_dev_configure(dev);
3182                 ehc->i.flags &= ~ATA_EHI_PRINTINFO;
3183                 if (rc) {
3184                         dev->class = ATA_DEV_UNKNOWN;
3185                         goto err;
3186                 }
3187
3188                 spin_lock_irqsave(ap->lock, flags);
3189                 ap->pflags |= ATA_PFLAG_SCSI_HOTPLUG;
3190                 spin_unlock_irqrestore(ap->lock, flags);
3191
3192                 /* new device discovered, configure xfermode */
3193                 ehc->i.flags |= ATA_EHI_SETMODE;
3194         }
3195
3196         return 0;
3197
3198  err:
3199         *r_failed_dev = dev;
3200         DPRINTK("EXIT rc=%d\n", rc);
3201         return rc;
3202 }
3203
3204 /**
3205  *      ata_set_mode - Program timings and issue SET FEATURES - XFER
3206  *      @link: link on which timings will be programmed
3207  *      @r_failed_dev: out parameter for failed device
3208  *
3209  *      Set ATA device disk transfer mode (PIO3, UDMA6, etc.).  If
3210  *      ata_set_mode() fails, pointer to the failing device is
3211  *      returned in @r_failed_dev.
3212  *
3213  *      LOCKING:
3214  *      PCI/etc. bus probe sem.
3215  *
3216  *      RETURNS:
3217  *      0 on success, negative errno otherwise
3218  */
3219 int ata_set_mode(struct ata_link *link, struct ata_device **r_failed_dev)
3220 {
3221         struct ata_port *ap = link->ap;
3222         struct ata_device *dev;
3223         int rc;
3224
3225         /* if data transfer is verified, clear DUBIOUS_XFER on ering top */
3226         ata_for_each_dev(dev, link, ENABLED) {
3227                 if (!(dev->flags & ATA_DFLAG_DUBIOUS_XFER)) {
3228                         struct ata_ering_entry *ent;
3229
3230                         ent = ata_ering_top(&dev->ering);
3231                         if (ent)
3232                                 ent->eflags &= ~ATA_EFLAG_DUBIOUS_XFER;
3233                 }
3234         }
3235
3236         /* has private set_mode? */
3237         if (ap->ops->set_mode)
3238                 rc = ap->ops->set_mode(link, r_failed_dev);
3239         else
3240                 rc = ata_do_set_mode(link, r_failed_dev);
3241
3242         /* if transfer mode has changed, set DUBIOUS_XFER on device */
3243         ata_for_each_dev(dev, link, ENABLED) {
3244                 struct ata_eh_context *ehc = &link->eh_context;
3245                 u8 saved_xfer_mode = ehc->saved_xfer_mode[dev->devno];
3246                 u8 saved_ncq = !!(ehc->saved_ncq_enabled & (1 << dev->devno));
3247
3248                 if (dev->xfer_mode != saved_xfer_mode ||
3249                     ata_ncq_enabled(dev) != saved_ncq)
3250                         dev->flags |= ATA_DFLAG_DUBIOUS_XFER;
3251         }
3252
3253         return rc;
3254 }
3255
3256 /**
3257  *      atapi_eh_clear_ua - Clear ATAPI UNIT ATTENTION after reset
3258  *      @dev: ATAPI device to clear UA for
3259  *
3260  *      Resets and other operations can make an ATAPI device raise
3261  *      UNIT ATTENTION which causes the next operation to fail.  This
3262  *      function clears UA.
3263  *
3264  *      LOCKING:
3265  *      EH context (may sleep).
3266  *
3267  *      RETURNS:
3268  *      0 on success, -errno on failure.
3269  */
3270 static int atapi_eh_clear_ua(struct ata_device *dev)
3271 {
3272         int i;
3273
3274         for (i = 0; i < ATA_EH_UA_TRIES; i++) {
3275                 u8 *sense_buffer = dev->link->ap->sector_buf;
3276                 u8 sense_key = 0;
3277                 unsigned int err_mask;
3278
3279                 err_mask = atapi_eh_tur(dev, &sense_key);
3280                 if (err_mask != 0 && err_mask != AC_ERR_DEV) {
3281                         ata_dev_warn(dev,
3282                                      "TEST_UNIT_READY failed (err_mask=0x%x)\n",
3283                                      err_mask);
3284                         return -EIO;
3285                 }
3286
3287                 if (!err_mask || sense_key != UNIT_ATTENTION)
3288                         return 0;
3289
3290                 err_mask = atapi_eh_request_sense(dev, sense_buffer, sense_key);
3291                 if (err_mask) {
3292                         ata_dev_warn(dev, "failed to clear "
3293                                 "UNIT ATTENTION (err_mask=0x%x)\n", err_mask);
3294                         return -EIO;
3295                 }
3296         }
3297
3298         ata_dev_warn(dev, "UNIT ATTENTION persists after %d tries\n",
3299                      ATA_EH_UA_TRIES);
3300
3301         return 0;
3302 }
3303
3304 /**
3305  *      ata_eh_maybe_retry_flush - Retry FLUSH if necessary
3306  *      @dev: ATA device which may need FLUSH retry
3307  *
3308  *      If @dev failed FLUSH, it needs to be reported upper layer
3309  *      immediately as it means that @dev failed to remap and already
3310  *      lost at least a sector and further FLUSH retrials won't make
3311  *      any difference to the lost sector.  However, if FLUSH failed
3312  *      for other reasons, for example transmission error, FLUSH needs
3313  *      to be retried.
3314  *
3315  *      This function determines whether FLUSH failure retry is
3316  *      necessary and performs it if so.
3317  *
3318  *      RETURNS:
3319  *      0 if EH can continue, -errno if EH needs to be repeated.
3320  */
3321 static int ata_eh_maybe_retry_flush(struct ata_device *dev)
3322 {
3323         struct ata_link *link = dev->link;
3324         struct ata_port *ap = link->ap;
3325         struct ata_queued_cmd *qc;
3326         struct ata_taskfile tf;
3327         unsigned int err_mask;
3328         int rc = 0;
3329
3330         /* did flush fail for this device? */
3331         if (!ata_tag_valid(link->active_tag))
3332                 return 0;
3333
3334         qc = __ata_qc_from_tag(ap, link->active_tag);
3335         if (qc->dev != dev || (qc->tf.command != ATA_CMD_FLUSH_EXT &&
3336                                qc->tf.command != ATA_CMD_FLUSH))
3337                 return 0;
3338
3339         /* if the device failed it, it should be reported to upper layers */
3340         if (qc->err_mask & AC_ERR_DEV)
3341                 return 0;
3342
3343         /* flush failed for some other reason, give it another shot */
3344         ata_tf_init(dev, &tf);
3345
3346         tf.command = qc->tf.command;
3347         tf.flags |= ATA_TFLAG_DEVICE;
3348         tf.protocol = ATA_PROT_NODATA;
3349
3350         ata_dev_warn(dev, "retrying FLUSH 0x%x Emask 0x%x\n",
3351                        tf.command, qc->err_mask);
3352
3353         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_NONE, NULL, 0, 0);
3354         if (!err_mask) {
3355                 /*
3356                  * FLUSH is complete but there's no way to
3357                  * successfully complete a failed command from EH.
3358                  * Making sure retry is allowed at least once and
3359                  * retrying it should do the trick - whatever was in
3360                  * the cache is already on the platter and this won't
3361                  * cause infinite loop.
3362                  */
3363                 qc->scsicmd->allowed = max(qc->scsicmd->allowed, 1);
3364         } else {
3365                 ata_dev_warn(dev, "FLUSH failed Emask 0x%x\n",
3366                                err_mask);
3367                 rc = -EIO;
3368
3369                 /* if device failed it, report it to upper layers */
3370                 if (err_mask & AC_ERR_DEV) {
3371                         qc->err_mask |= AC_ERR_DEV;
3372                         qc->result_tf = tf;
3373                         if (!(ap->pflags & ATA_PFLAG_FROZEN))
3374                                 rc = 0;
3375                 }
3376         }
3377         return rc;
3378 }
3379
3380 /**
3381  *      ata_eh_set_lpm - configure SATA interface power management
3382  *      @link: link to configure power management
3383  *      @policy: the link power management policy
3384  *      @r_failed_dev: out parameter for failed device
3385  *
3386  *      Enable SATA Interface power management.  This will enable
3387  *      Device Interface Power Management (DIPM) for min_power
3388  *      policy, and then call driver specific callbacks for
3389  *      enabling Host Initiated Power management.
3390  *
3391  *      LOCKING:
3392  *      EH context.
3393  *
3394  *      RETURNS:
3395  *      0 on success, -errno on failure.
3396  */
3397 static int ata_eh_set_lpm(struct ata_link *link, enum ata_lpm_policy policy,
3398                           struct ata_device **r_failed_dev)
3399 {
3400         struct ata_port *ap = ata_is_host_link(link) ? link->ap : NULL;
3401         struct ata_eh_context *ehc = &link->eh_context;
3402         struct ata_device *dev, *link_dev = NULL, *lpm_dev = NULL;
3403         enum ata_lpm_policy old_policy = link->lpm_policy;
3404         bool no_dipm = link->ap->flags & ATA_FLAG_NO_DIPM;
3405         unsigned int hints = ATA_LPM_EMPTY | ATA_LPM_HIPM;
3406         unsigned int err_mask;
3407         int rc;
3408
3409         /* if the link or host doesn't do LPM, noop */
3410         if ((link->flags & ATA_LFLAG_NO_LPM) || (ap && !ap->ops->set_lpm))
3411                 return 0;
3412
3413         /*
3414          * DIPM is enabled only for MIN_POWER as some devices
3415          * misbehave when the host NACKs transition to SLUMBER.  Order
3416          * device and link configurations such that the host always
3417          * allows DIPM requests.
3418          */
3419         ata_for_each_dev(dev, link, ENABLED) {
3420                 bool hipm = ata_id_has_hipm(dev->id);
3421                 bool dipm = ata_id_has_dipm(dev->id) && !no_dipm;
3422
3423                 /* find the first enabled and LPM enabled devices */
3424                 if (!link_dev)
3425                         link_dev = dev;
3426
3427                 if (!lpm_dev && (hipm || dipm))
3428                         lpm_dev = dev;
3429
3430                 hints &= ~ATA_LPM_EMPTY;
3431                 if (!hipm)
3432                         hints &= ~ATA_LPM_HIPM;
3433
3434                 /* disable DIPM before changing link config */
3435                 if (policy != ATA_LPM_MIN_POWER && dipm) {
3436                         err_mask = ata_dev_set_feature(dev,
3437                                         SETFEATURES_SATA_DISABLE, SATA_DIPM);
3438                         if (err_mask && err_mask != AC_ERR_DEV) {
3439                                 ata_dev_warn(dev,
3440                                              "failed to disable DIPM, Emask 0x%x\n",
3441                                              err_mask);
3442                                 rc = -EIO;
3443                                 goto fail;
3444                         }
3445                 }
3446         }
3447
3448         if (ap) {
3449                 rc = ap->ops->set_lpm(link, policy, hints);
3450                 if (!rc && ap->slave_link)
3451                         rc = ap->ops->set_lpm(ap->slave_link, policy, hints);
3452         } else
3453                 rc = sata_pmp_set_lpm(link, policy, hints);
3454
3455         /*
3456          * Attribute link config failure to the first (LPM) enabled
3457          * device on the link.
3458          */
3459         if (rc) {
3460                 if (rc == -EOPNOTSUPP) {
3461                         link->flags |= ATA_LFLAG_NO_LPM;
3462                         return 0;
3463                 }
3464                 dev = lpm_dev ? lpm_dev : link_dev;
3465                 goto fail;
3466         }
3467
3468         /*
3469          * Low level driver acked the transition.  Issue DIPM command
3470          * with the new policy set.
3471          */
3472         link->lpm_policy = policy;
3473         if (ap && ap->slave_link)
3474                 ap->slave_link->lpm_policy = policy;
3475
3476         /* host config updated, enable DIPM if transitioning to MIN_POWER */
3477         ata_for_each_dev(dev, link, ENABLED) {
3478                 if (policy == ATA_LPM_MIN_POWER && !no_dipm &&
3479                     ata_id_has_dipm(dev->id)) {
3480                         err_mask = ata_dev_set_feature(dev,
3481                                         SETFEATURES_SATA_ENABLE, SATA_DIPM);
3482                         if (err_mask && err_mask != AC_ERR_DEV) {
3483                                 ata_dev_warn(dev,
3484                                         "failed to enable DIPM, Emask 0x%x\n",
3485                                         err_mask);
3486                                 rc = -EIO;
3487                                 goto fail;
3488                         }
3489                 }
3490         }
3491
3492         return 0;
3493
3494 fail:
3495         /* restore the old policy */
3496         link->lpm_policy = old_policy;
3497         if (ap && ap->slave_link)
3498                 ap->slave_link->lpm_policy = old_policy;
3499
3500         /* if no device or only one more chance is left, disable LPM */
3501         if (!dev || ehc->tries[dev->devno] <= 2) {
3502                 ata_link_warn(link, "disabling LPM on the link\n");
3503                 link->flags |= ATA_LFLAG_NO_LPM;
3504         }
3505         if (r_failed_dev)
3506                 *r_failed_dev = dev;
3507         return rc;
3508 }
3509
3510 int ata_link_nr_enabled(struct ata_link *link)
3511 {
3512         struct ata_device *dev;
3513         int cnt = 0;
3514
3515         ata_for_each_dev(dev, link, ENABLED)
3516                 cnt++;
3517         return cnt;
3518 }
3519
3520 static int ata_link_nr_vacant(struct ata_link *link)
3521 {
3522         struct ata_device *dev;
3523         int cnt = 0;
3524
3525         ata_for_each_dev(dev, link, ALL)
3526                 if (dev->class == ATA_DEV_UNKNOWN)
3527                         cnt++;
3528         return cnt;
3529 }
3530
3531 static int ata_eh_skip_recovery(struct ata_link *link)
3532 {
3533         struct ata_port *ap = link->ap;
3534         struct ata_eh_context *ehc = &link->eh_context;
3535         struct ata_device *dev;
3536
3537         /* skip disabled links */
3538         if (link->flags & ATA_LFLAG_DISABLED)
3539                 return 1;
3540
3541         /* skip if explicitly requested */
3542         if (ehc->i.flags & ATA_EHI_NO_RECOVERY)
3543                 return 1;
3544
3545         /* thaw frozen port and recover failed devices */
3546         if ((ap->pflags & ATA_PFLAG_FROZEN) || ata_link_nr_enabled(link))
3547                 return 0;
3548
3549         /* reset at least once if reset is requested */
3550         if ((ehc->i.action & ATA_EH_RESET) &&
3551             !(ehc->i.flags & ATA_EHI_DID_RESET))
3552                 return 0;
3553
3554         /* skip if class codes for all vacant slots are ATA_DEV_NONE */
3555         ata_for_each_dev(dev, link, ALL) {
3556                 if (dev->class == ATA_DEV_UNKNOWN &&
3557                     ehc->classes[dev->devno] != ATA_DEV_NONE)
3558                         return 0;
3559         }
3560
3561         return 1;
3562 }
3563
3564 static int ata_count_probe_trials_cb(struct ata_ering_entry *ent, void *void_arg)
3565 {
3566         u64 interval = msecs_to_jiffies(ATA_EH_PROBE_TRIAL_INTERVAL);
3567         u64 now = get_jiffies_64();
3568         int *trials = void_arg;
3569
3570         if ((ent->eflags & ATA_EFLAG_OLD_ER) ||
3571             (ent->timestamp < now - min(now, interval)))
3572                 return -1;
3573
3574         (*trials)++;
3575         return 0;
3576 }
3577
3578 static int ata_eh_schedule_probe(struct ata_device *dev)
3579 {
3580         struct ata_eh_context *ehc = &dev->link->eh_context;
3581         struct ata_link *link = ata_dev_phys_link(dev);
3582         int trials = 0;
3583
3584         if (!(ehc->i.probe_mask & (1 << dev->devno)) ||
3585             (ehc->did_probe_mask & (1 << dev->devno)))
3586                 return 0;
3587
3588         ata_eh_detach_dev(dev);
3589         ata_dev_init(dev);
3590         ehc->did_probe_mask |= (1 << dev->devno);
3591         ehc->i.action |= ATA_EH_RESET;
3592         ehc->saved_xfer_mode[dev->devno] = 0;
3593         ehc->saved_ncq_enabled &= ~(1 << dev->devno);
3594
3595         /* the link maybe in a deep sleep, wake it up */
3596         if (link->lpm_policy > ATA_LPM_MAX_POWER) {
3597                 if (ata_is_host_link(link))
3598                         link->ap->ops->set_lpm(link, ATA_LPM_MAX_POWER,
3599                                                ATA_LPM_EMPTY);
3600                 else
3601                         sata_pmp_set_lpm(link, ATA_LPM_MAX_POWER,
3602                                          ATA_LPM_EMPTY);
3603         }
3604
3605         /* Record and count probe trials on the ering.  The specific
3606          * error mask used is irrelevant.  Because a successful device
3607          * detection clears the ering, this count accumulates only if
3608          * there are consecutive failed probes.
3609          *
3610          * If the count is equal to or higher than ATA_EH_PROBE_TRIALS
3611          * in the last ATA_EH_PROBE_TRIAL_INTERVAL, link speed is
3612          * forced to 1.5Gbps.
3613          *
3614          * This is to work around cases where failed link speed
3615          * negotiation results in device misdetection leading to
3616          * infinite DEVXCHG or PHRDY CHG events.
3617          */
3618         ata_ering_record(&dev->ering, 0, AC_ERR_OTHER);
3619         ata_ering_map(&dev->ering, ata_count_probe_trials_cb, &trials);
3620
3621         if (trials > ATA_EH_PROBE_TRIALS)
3622                 sata_down_spd_limit(link, 1);
3623
3624         return 1;
3625 }
3626
3627 static int ata_eh_handle_dev_fail(struct ata_device *dev, int err)
3628 {
3629         struct ata_eh_context *ehc = &dev->link->eh_context;
3630
3631         /* -EAGAIN from EH routine indicates retry without prejudice.
3632          * The requester is responsible for ensuring forward progress.
3633          */
3634         if (err != -EAGAIN)
3635                 ehc->tries[dev->devno]--;
3636
3637         switch (err) {
3638         case -ENODEV:
3639                 /* device missing or wrong IDENTIFY data, schedule probing */
3640                 ehc->i.probe_mask |= (1 << dev->devno);
3641         case -EINVAL:
3642                 /* give it just one more chance */
3643                 ehc->tries[dev->devno] = min(ehc->tries[dev->devno], 1);
3644         case -EIO:
3645                 if (ehc->tries[dev->devno] == 1) {
3646                         /* This is the last chance, better to slow
3647                          * down than lose it.
3648                          */
3649                         sata_down_spd_limit(ata_dev_phys_link(dev), 0);
3650                         if (dev->pio_mode > XFER_PIO_0)
3651                                 ata_down_xfermask_limit(dev, ATA_DNXFER_PIO);
3652                 }
3653         }
3654
3655         if (ata_dev_enabled(dev) && !ehc->tries[dev->devno]) {
3656                 /* disable device if it has used up all its chances */
3657                 ata_dev_disable(dev);
3658
3659                 /* detach if offline */
3660                 if (ata_phys_link_offline(ata_dev_phys_link(dev)))
3661                         ata_eh_detach_dev(dev);
3662
3663                 /* schedule probe if necessary */
3664                 if (ata_eh_schedule_probe(dev)) {
3665                         ehc->tries[dev->devno] = ATA_EH_DEV_TRIES;
3666                         memset(ehc->cmd_timeout_idx[dev->devno], 0,
3667                                sizeof(ehc->cmd_timeout_idx[dev->devno]));
3668                 }
3669
3670                 return 1;
3671         } else {
3672                 ehc->i.action |= ATA_EH_RESET;
3673                 return 0;
3674         }
3675 }
3676
3677 /**
3678  *      ata_eh_recover - recover host port after error
3679  *      @ap: host port to recover
3680  *      @prereset: prereset method (can be NULL)
3681  *      @softreset: softreset method (can be NULL)
3682  *      @hardreset: hardreset method (can be NULL)
3683  *      @postreset: postreset method (can be NULL)
3684  *      @r_failed_link: out parameter for failed link
3685  *
3686  *      This is the alpha and omega, eum and yang, heart and soul of
3687  *      libata exception handling.  On entry, actions required to
3688  *      recover each link and hotplug requests are recorded in the
3689  *      link's eh_context.  This function executes all the operations
3690  *      with appropriate retrials and fallbacks to resurrect failed
3691  *      devices, detach goners and greet newcomers.
3692  *
3693  *      LOCKING:
3694  *      Kernel thread context (may sleep).
3695  *
3696  *      RETURNS:
3697  *      0 on success, -errno on failure.
3698  */
3699 int ata_eh_recover(struct ata_port *ap, ata_prereset_fn_t prereset,
3700                    ata_reset_fn_t softreset, ata_reset_fn_t hardreset,
3701                    ata_postreset_fn_t postreset,
3702                    struct ata_link **r_failed_link)
3703 {
3704         struct ata_link *link;
3705         struct ata_device *dev;
3706         int rc, nr_fails;
3707         unsigned long flags, deadline;
3708
3709         DPRINTK("ENTER\n");
3710
3711         /* prep for recovery */
3712         ata_for_each_link(link, ap, EDGE) {
3713                 struct ata_eh_context *ehc = &link->eh_context;
3714
3715                 /* re-enable link? */
3716                 if (ehc->i.action & ATA_EH_ENABLE_LINK) {
3717                         ata_eh_about_to_do(link, NULL, ATA_EH_ENABLE_LINK);
3718                         spin_lock_irqsave(ap->lock, flags);
3719                         link->flags &= ~ATA_LFLAG_DISABLED;
3720                         spin_unlock_irqrestore(ap->lock, flags);
3721                         ata_eh_done(link, NULL, ATA_EH_ENABLE_LINK);
3722                 }
3723
3724                 ata_for_each_dev(dev, link, ALL) {
3725                         if (link->flags & ATA_LFLAG_NO_RETRY)
3726                                 ehc->tries[dev->devno] = 1;
3727                         else
3728                                 ehc->tries[dev->devno] = ATA_EH_DEV_TRIES;
3729
3730                         /* collect port action mask recorded in dev actions */
3731                         ehc->i.action |= ehc->i.dev_action[dev->devno] &
3732                                          ~ATA_EH_PERDEV_MASK;
3733                         ehc->i.dev_action[dev->devno] &= ATA_EH_PERDEV_MASK;
3734
3735                         /* process hotplug request */
3736                         if (dev->flags & ATA_DFLAG_DETACH)
3737                                 ata_eh_detach_dev(dev);
3738
3739                         /* schedule probe if necessary */
3740                         if (!ata_dev_enabled(dev))
3741                                 ata_eh_schedule_probe(dev);
3742                 }
3743         }
3744
3745  retry:
3746         rc = 0;
3747
3748         /* if UNLOADING, finish immediately */
3749         if (ap->pflags & ATA_PFLAG_UNLOADING)
3750                 goto out;
3751
3752         /* prep for EH */
3753         ata_for_each_link(link, ap, EDGE) {
3754                 struct ata_eh_context *ehc = &link->eh_context;
3755
3756                 /* skip EH if possible. */
3757                 if (ata_eh_skip_recovery(link))
3758                         ehc->i.action = 0;
3759
3760                 ata_for_each_dev(dev, link, ALL)
3761                         ehc->classes[dev->devno] = ATA_DEV_UNKNOWN;
3762         }
3763
3764         /* reset */
3765         ata_for_each_link(link, ap, EDGE) {
3766                 struct ata_eh_context *ehc = &link->eh_context;
3767
3768                 if (!(ehc->i.action & ATA_EH_RESET))
3769                         continue;
3770
3771                 rc = ata_eh_reset(link, ata_link_nr_vacant(link),
3772                                   prereset, softreset, hardreset, postreset);
3773                 if (rc) {
3774                         ata_link_err(link, "reset failed, giving up\n");
3775                         goto out;
3776                 }
3777         }
3778
3779         do {
3780                 unsigned long now;
3781
3782                 /*
3783                  * clears ATA_EH_PARK in eh_info and resets
3784                  * ap->park_req_pending
3785                  */
3786                 ata_eh_pull_park_action(ap);
3787
3788                 deadline = jiffies;
3789                 ata_for_each_link(link, ap, EDGE) {
3790                         ata_for_each_dev(dev, link, ALL) {
3791                                 struct ata_eh_context *ehc = &link->eh_context;
3792                                 unsigned long tmp;
3793
3794                                 if (dev->class != ATA_DEV_ATA)
3795                                         continue;
3796                                 if (!(ehc->i.dev_action[dev->devno] &
3797                                       ATA_EH_PARK))
3798                                         continue;
3799                                 tmp = dev->unpark_deadline;
3800                                 if (time_before(deadline, tmp))
3801                                         deadline = tmp;
3802                                 else if (time_before_eq(tmp, jiffies))
3803                                         continue;
3804                                 if (ehc->unloaded_mask & (1 << dev->devno))
3805                                         continue;
3806
3807                                 ata_eh_park_issue_cmd(dev, 1);
3808                         }
3809                 }
3810
3811                 now = jiffies;
3812                 if (time_before_eq(deadline, now))
3813                         break;
3814
3815                 ata_eh_release(ap);
3816                 deadline = wait_for_completion_timeout(&ap->park_req_pending,
3817                                                        deadline - now);
3818                 ata_eh_acquire(ap);
3819         } while (deadline);
3820         ata_for_each_link(link, ap, EDGE) {
3821                 ata_for_each_dev(dev, link, ALL) {
3822                         if (!(link->eh_context.unloaded_mask &
3823                               (1 << dev->devno)))
3824                                 continue;
3825
3826                         ata_eh_park_issue_cmd(dev, 0);
3827                         ata_eh_done(link, dev, ATA_EH_PARK);
3828                 }
3829         }
3830
3831         /* the rest */
3832         nr_fails = 0;
3833         ata_for_each_link(link, ap, PMP_FIRST) {
3834                 struct ata_eh_context *ehc = &link->eh_context;
3835
3836                 if (sata_pmp_attached(ap) && ata_is_host_link(link))
3837                         goto config_lpm;
3838
3839                 /* revalidate existing devices and attach new ones */
3840                 rc = ata_eh_revalidate_and_attach(link, &dev);
3841                 if (rc)
3842                         goto rest_fail;
3843
3844                 /* if PMP got attached, return, pmp EH will take care of it */
3845                 if (link->device->class == ATA_DEV_PMP) {
3846                         ehc->i.action = 0;
3847                         return 0;
3848                 }
3849
3850                 /* configure transfer mode if necessary */
3851                 if (ehc->i.flags & ATA_EHI_SETMODE) {
3852                         rc = ata_set_mode(link, &dev);
3853                         if (rc)
3854                                 goto rest_fail;
3855                         ehc->i.flags &= ~ATA_EHI_SETMODE;
3856                 }
3857
3858                 /* If reset has been issued, clear UA to avoid
3859                  * disrupting the current users of the device.
3860                  */
3861                 if (ehc->i.flags & ATA_EHI_DID_RESET) {
3862                         ata_for_each_dev(dev, link, ALL) {
3863                                 if (dev->class != ATA_DEV_ATAPI)
3864                                         continue;
3865                                 rc = atapi_eh_clear_ua(dev);
3866                                 if (rc)
3867                                         goto rest_fail;
3868                                 if (zpodd_dev_enabled(dev))
3869                                         zpodd_post_poweron(dev);
3870                         }
3871                 }
3872
3873                 /* retry flush if necessary */
3874                 ata_for_each_dev(dev, link, ALL) {
3875                         if (dev->class != ATA_DEV_ATA)
3876                                 continue;
3877                         rc = ata_eh_maybe_retry_flush(dev);
3878                         if (rc)
3879                                 goto rest_fail;
3880                 }
3881
3882         config_lpm:
3883                 /* configure link power saving */
3884                 if (link->lpm_policy != ap->target_lpm_policy) {
3885                         rc = ata_eh_set_lpm(link, ap->target_lpm_policy, &dev);
3886                         if (rc)
3887                                 goto rest_fail;
3888                 }
3889
3890                 /* this link is okay now */
3891                 ehc->i.flags = 0;
3892                 continue;
3893
3894         rest_fail:
3895                 nr_fails++;
3896                 if (dev)
3897                         ata_eh_handle_dev_fail(dev, rc);
3898
3899                 if (ap->pflags & ATA_PFLAG_FROZEN) {
3900                         /* PMP reset requires working host port.
3901                          * Can't retry if it's frozen.
3902                          */
3903                         if (sata_pmp_attached(ap))
3904                                 goto out;
3905                         break;
3906                 }
3907         }
3908
3909         if (nr_fails)
3910                 goto retry;
3911
3912  out:
3913         if (rc && r_failed_link)
3914                 *r_failed_link = link;
3915
3916         DPRINTK("EXIT, rc=%d\n", rc);
3917         return rc;
3918 }
3919
3920 /**
3921  *      ata_eh_finish - finish up EH
3922  *      @ap: host port to finish EH for
3923  *
3924  *      Recovery is complete.  Clean up EH states and retry or finish
3925  *      failed qcs.
3926  *
3927  *      LOCKING:
3928  *      None.
3929  */
3930 void ata_eh_finish(struct ata_port *ap)
3931 {
3932         int tag;
3933
3934         /* retry or finish qcs */
3935         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
3936                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
3937
3938                 if (!(qc->flags & ATA_QCFLAG_FAILED))
3939                         continue;
3940
3941                 if (qc->err_mask) {
3942                         /* FIXME: Once EH migration is complete,
3943                          * generate sense data in this function,
3944                          * considering both err_mask and tf.
3945                          */
3946                         if (qc->flags & ATA_QCFLAG_RETRY)
3947                                 ata_eh_qc_retry(qc);
3948                         else
3949                                 ata_eh_qc_complete(qc);
3950                 } else {
3951                         if (qc->flags & ATA_QCFLAG_SENSE_VALID) {
3952                                 ata_eh_qc_complete(qc);
3953                         } else {
3954                                 /* feed zero TF to sense generation */
3955                                 memset(&qc->result_tf, 0, sizeof(qc->result_tf));
3956                                 ata_eh_qc_retry(qc);
3957                         }
3958                 }
3959         }
3960
3961         /* make sure nr_active_links is zero after EH */
3962         WARN_ON(ap->nr_active_links);
3963         ap->nr_active_links = 0;
3964 }
3965
3966 /**
3967  *      ata_do_eh - do standard error handling
3968  *      @ap: host port to handle error for
3969  *
3970  *      @prereset: prereset method (can be NULL)
3971  *      @softreset: softreset method (can be NULL)
3972  *      @hardreset: hardreset method (can be NULL)
3973  *      @postreset: postreset method (can be NULL)
3974  *
3975  *      Perform standard error handling sequence.
3976  *
3977  *      LOCKING:
3978  *      Kernel thread context (may sleep).
3979  */
3980 void ata_do_eh(struct ata_port *ap, ata_prereset_fn_t prereset,
3981                ata_reset_fn_t softreset, ata_reset_fn_t hardreset,
3982                ata_postreset_fn_t postreset)
3983 {
3984         struct ata_device *dev;
3985         int rc;
3986
3987         ata_eh_autopsy(ap);
3988         ata_eh_report(ap);
3989
3990         rc = ata_eh_recover(ap, prereset, softreset, hardreset, postreset,
3991                             NULL);
3992         if (rc) {
3993                 ata_for_each_dev(dev, &ap->link, ALL)
3994                         ata_dev_disable(dev);
3995         }
3996
3997         ata_eh_finish(ap);
3998 }
3999
4000 /**
4001  *      ata_std_error_handler - standard error handler
4002  *      @ap: host port to handle error for
4003  *
4004  *      Standard error handler
4005  *
4006  *      LOCKING:
4007  *      Kernel thread context (may sleep).
4008  */
4009 void ata_std_error_handler(struct ata_port *ap)
4010 {
4011         struct ata_port_operations *ops = ap->ops;
4012         ata_reset_fn_t hardreset = ops->hardreset;
4013
4014         /* ignore built-in hardreset if SCR access is not available */
4015         if (hardreset == sata_std_hardreset && !sata_scr_valid(&ap->link))
4016                 hardreset = NULL;
4017
4018         ata_do_eh(ap, ops->prereset, ops->softreset, hardreset, ops->postreset);
4019 }
4020
4021 #ifdef CONFIG_PM
4022 /**
4023  *      ata_eh_handle_port_suspend - perform port suspend operation
4024  *      @ap: port to suspend
4025  *
4026  *      Suspend @ap.
4027  *
4028  *      LOCKING:
4029  *      Kernel thread context (may sleep).
4030  */
4031 static void ata_eh_handle_port_suspend(struct ata_port *ap)
4032 {
4033         unsigned long flags;
4034         int rc = 0;
4035         struct ata_device *dev;
4036
4037         /* are we suspending? */
4038         spin_lock_irqsave(ap->lock, flags);
4039         if (!(ap->pflags & ATA_PFLAG_PM_PENDING) ||
4040             ap->pm_mesg.event & PM_EVENT_RESUME) {
4041                 spin_unlock_irqrestore(ap->lock, flags);
4042                 return;
4043         }
4044         spin_unlock_irqrestore(ap->lock, flags);
4045
4046         WARN_ON(ap->pflags & ATA_PFLAG_SUSPENDED);
4047
4048         /*
4049          * If we have a ZPODD attached, check its zero
4050          * power ready status before the port is frozen.
4051          * Only needed for runtime suspend.
4052          */
4053         if (PMSG_IS_AUTO(ap->pm_mesg)) {
4054                 ata_for_each_dev(dev, &ap->link, ENABLED) {
4055                         if (zpodd_dev_enabled(dev))
4056                                 zpodd_on_suspend(dev);
4057                 }
4058         }
4059
4060         /* tell ACPI we're suspending */
4061         rc = ata_acpi_on_suspend(ap);
4062         if (rc)
4063                 goto out;
4064
4065         /* suspend */
4066         ata_eh_freeze_port(ap);
4067
4068         if (ap->ops->port_suspend)
4069                 rc = ap->ops->port_suspend(ap, ap->pm_mesg);
4070
4071         ata_acpi_set_state(ap, ap->pm_mesg);
4072  out:
4073         /* update the flags */
4074         spin_lock_irqsave(ap->lock, flags);
4075
4076         ap->pflags &= ~ATA_PFLAG_PM_PENDING;
4077         if (rc == 0)
4078                 ap->pflags |= ATA_PFLAG_SUSPENDED;
4079         else if (ap->pflags & ATA_PFLAG_FROZEN)
4080                 ata_port_schedule_eh(ap);
4081
4082         spin_unlock_irqrestore(ap->lock, flags);
4083
4084         return;
4085 }
4086
4087 /**
4088  *      ata_eh_handle_port_resume - perform port resume operation
4089  *      @ap: port to resume
4090  *
4091  *      Resume @ap.
4092  *
4093  *      LOCKING:
4094  *      Kernel thread context (may sleep).
4095  */
4096 static void ata_eh_handle_port_resume(struct ata_port *ap)
4097 {
4098         struct ata_link *link;
4099         struct ata_device *dev;
4100         unsigned long flags;
4101         int rc = 0;
4102
4103         /* are we resuming? */
4104         spin_lock_irqsave(ap->lock, flags);
4105         if (!(ap->pflags & ATA_PFLAG_PM_PENDING) ||
4106             !(ap->pm_mesg.event & PM_EVENT_RESUME)) {
4107                 spin_unlock_irqrestore(ap->lock, flags);
4108                 return;
4109         }
4110         spin_unlock_irqrestore(ap->lock, flags);
4111
4112         WARN_ON(!(ap->pflags & ATA_PFLAG_SUSPENDED));
4113
4114         /*
4115          * Error timestamps are in jiffies which doesn't run while
4116          * suspended and PHY events during resume isn't too uncommon.
4117          * When the two are combined, it can lead to unnecessary speed
4118          * downs if the machine is suspended and resumed repeatedly.
4119          * Clear error history.
4120          */
4121         ata_for_each_link(link, ap, HOST_FIRST)
4122                 ata_for_each_dev(dev, link, ALL)
4123                         ata_ering_clear(&dev->ering);
4124
4125         ata_acpi_set_state(ap, ap->pm_mesg);
4126
4127         if (ap->ops->port_resume)
4128                 rc = ap->ops->port_resume(ap);
4129
4130         /* tell ACPI that we're resuming */
4131         ata_acpi_on_resume(ap);
4132
4133         /* update the flags */
4134         spin_lock_irqsave(ap->lock, flags);
4135         ap->pflags &= ~(ATA_PFLAG_PM_PENDING | ATA_PFLAG_SUSPENDED);
4136         spin_unlock_irqrestore(ap->lock, flags);
4137 }
4138 #endif /* CONFIG_PM */