]> git.kernelconcepts.de Git - karo-tx-linux.git/blob - drivers/pci/pci.c
PCI/AER: Clear error status registers during enumeration and restore
[karo-tx-linux.git] / drivers / pci / pci.c
1 /*
2  *      PCI Bus Services, see include/linux/pci.h for further explanation.
3  *
4  *      Copyright 1993 -- 1997 Drew Eckhardt, Frederic Potter,
5  *      David Mosberger-Tang
6  *
7  *      Copyright 1997 -- 2000 Martin Mares <mj@ucw.cz>
8  */
9
10 #include <linux/kernel.h>
11 #include <linux/delay.h>
12 #include <linux/init.h>
13 #include <linux/of.h>
14 #include <linux/of_pci.h>
15 #include <linux/pci.h>
16 #include <linux/pm.h>
17 #include <linux/slab.h>
18 #include <linux/module.h>
19 #include <linux/spinlock.h>
20 #include <linux/string.h>
21 #include <linux/log2.h>
22 #include <linux/pci-aspm.h>
23 #include <linux/pm_wakeup.h>
24 #include <linux/interrupt.h>
25 #include <linux/device.h>
26 #include <linux/pm_runtime.h>
27 #include <linux/pci_hotplug.h>
28 #include <asm-generic/pci-bridge.h>
29 #include <asm/setup.h>
30 #include <linux/aer.h>
31 #include "pci.h"
32
33 const char *pci_power_names[] = {
34         "error", "D0", "D1", "D2", "D3hot", "D3cold", "unknown",
35 };
36 EXPORT_SYMBOL_GPL(pci_power_names);
37
38 int isa_dma_bridge_buggy;
39 EXPORT_SYMBOL(isa_dma_bridge_buggy);
40
41 int pci_pci_problems;
42 EXPORT_SYMBOL(pci_pci_problems);
43
44 unsigned int pci_pm_d3_delay;
45
46 static void pci_pme_list_scan(struct work_struct *work);
47
48 static LIST_HEAD(pci_pme_list);
49 static DEFINE_MUTEX(pci_pme_list_mutex);
50 static DECLARE_DELAYED_WORK(pci_pme_work, pci_pme_list_scan);
51
52 struct pci_pme_device {
53         struct list_head list;
54         struct pci_dev *dev;
55 };
56
57 #define PME_TIMEOUT 1000 /* How long between PME checks */
58
59 static void pci_dev_d3_sleep(struct pci_dev *dev)
60 {
61         unsigned int delay = dev->d3_delay;
62
63         if (delay < pci_pm_d3_delay)
64                 delay = pci_pm_d3_delay;
65
66         msleep(delay);
67 }
68
69 #ifdef CONFIG_PCI_DOMAINS
70 int pci_domains_supported = 1;
71 #endif
72
73 #define DEFAULT_CARDBUS_IO_SIZE         (256)
74 #define DEFAULT_CARDBUS_MEM_SIZE        (64*1024*1024)
75 /* pci=cbmemsize=nnM,cbiosize=nn can override this */
76 unsigned long pci_cardbus_io_size = DEFAULT_CARDBUS_IO_SIZE;
77 unsigned long pci_cardbus_mem_size = DEFAULT_CARDBUS_MEM_SIZE;
78
79 #define DEFAULT_HOTPLUG_IO_SIZE         (256)
80 #define DEFAULT_HOTPLUG_MEM_SIZE        (2*1024*1024)
81 /* pci=hpmemsize=nnM,hpiosize=nn can override this */
82 unsigned long pci_hotplug_io_size  = DEFAULT_HOTPLUG_IO_SIZE;
83 unsigned long pci_hotplug_mem_size = DEFAULT_HOTPLUG_MEM_SIZE;
84
85 enum pcie_bus_config_types pcie_bus_config = PCIE_BUS_DEFAULT;
86
87 /*
88  * The default CLS is used if arch didn't set CLS explicitly and not
89  * all pci devices agree on the same value.  Arch can override either
90  * the dfl or actual value as it sees fit.  Don't forget this is
91  * measured in 32-bit words, not bytes.
92  */
93 u8 pci_dfl_cache_line_size = L1_CACHE_BYTES >> 2;
94 u8 pci_cache_line_size;
95
96 /*
97  * If we set up a device for bus mastering, we need to check the latency
98  * timer as certain BIOSes forget to set it properly.
99  */
100 unsigned int pcibios_max_latency = 255;
101
102 /* If set, the PCIe ARI capability will not be used. */
103 static bool pcie_ari_disabled;
104
105 /**
106  * pci_bus_max_busnr - returns maximum PCI bus number of given bus' children
107  * @bus: pointer to PCI bus structure to search
108  *
109  * Given a PCI bus, returns the highest PCI bus number present in the set
110  * including the given PCI bus and its list of child PCI buses.
111  */
112 unsigned char pci_bus_max_busnr(struct pci_bus *bus)
113 {
114         struct pci_bus *tmp;
115         unsigned char max, n;
116
117         max = bus->busn_res.end;
118         list_for_each_entry(tmp, &bus->children, node) {
119                 n = pci_bus_max_busnr(tmp);
120                 if (n > max)
121                         max = n;
122         }
123         return max;
124 }
125 EXPORT_SYMBOL_GPL(pci_bus_max_busnr);
126
127 #ifdef CONFIG_HAS_IOMEM
128 void __iomem *pci_ioremap_bar(struct pci_dev *pdev, int bar)
129 {
130         struct resource *res = &pdev->resource[bar];
131
132         /*
133          * Make sure the BAR is actually a memory resource, not an IO resource
134          */
135         if (res->flags & IORESOURCE_UNSET || !(res->flags & IORESOURCE_MEM)) {
136                 dev_warn(&pdev->dev, "can't ioremap BAR %d: %pR\n", bar, res);
137                 return NULL;
138         }
139         return ioremap_nocache(res->start, resource_size(res));
140 }
141 EXPORT_SYMBOL_GPL(pci_ioremap_bar);
142
143 void __iomem *pci_ioremap_wc_bar(struct pci_dev *pdev, int bar)
144 {
145         /*
146          * Make sure the BAR is actually a memory resource, not an IO resource
147          */
148         if (!(pci_resource_flags(pdev, bar) & IORESOURCE_MEM)) {
149                 WARN_ON(1);
150                 return NULL;
151         }
152         return ioremap_wc(pci_resource_start(pdev, bar),
153                           pci_resource_len(pdev, bar));
154 }
155 EXPORT_SYMBOL_GPL(pci_ioremap_wc_bar);
156 #endif
157
158
159 static int __pci_find_next_cap_ttl(struct pci_bus *bus, unsigned int devfn,
160                                    u8 pos, int cap, int *ttl)
161 {
162         u8 id;
163         u16 ent;
164
165         pci_bus_read_config_byte(bus, devfn, pos, &pos);
166
167         while ((*ttl)--) {
168                 if (pos < 0x40)
169                         break;
170                 pos &= ~3;
171                 pci_bus_read_config_word(bus, devfn, pos, &ent);
172
173                 id = ent & 0xff;
174                 if (id == 0xff)
175                         break;
176                 if (id == cap)
177                         return pos;
178                 pos = (ent >> 8);
179         }
180         return 0;
181 }
182
183 static int __pci_find_next_cap(struct pci_bus *bus, unsigned int devfn,
184                                u8 pos, int cap)
185 {
186         int ttl = PCI_FIND_CAP_TTL;
187
188         return __pci_find_next_cap_ttl(bus, devfn, pos, cap, &ttl);
189 }
190
191 int pci_find_next_capability(struct pci_dev *dev, u8 pos, int cap)
192 {
193         return __pci_find_next_cap(dev->bus, dev->devfn,
194                                    pos + PCI_CAP_LIST_NEXT, cap);
195 }
196 EXPORT_SYMBOL_GPL(pci_find_next_capability);
197
198 static int __pci_bus_find_cap_start(struct pci_bus *bus,
199                                     unsigned int devfn, u8 hdr_type)
200 {
201         u16 status;
202
203         pci_bus_read_config_word(bus, devfn, PCI_STATUS, &status);
204         if (!(status & PCI_STATUS_CAP_LIST))
205                 return 0;
206
207         switch (hdr_type) {
208         case PCI_HEADER_TYPE_NORMAL:
209         case PCI_HEADER_TYPE_BRIDGE:
210                 return PCI_CAPABILITY_LIST;
211         case PCI_HEADER_TYPE_CARDBUS:
212                 return PCI_CB_CAPABILITY_LIST;
213         }
214
215         return 0;
216 }
217
218 /**
219  * pci_find_capability - query for devices' capabilities
220  * @dev: PCI device to query
221  * @cap: capability code
222  *
223  * Tell if a device supports a given PCI capability.
224  * Returns the address of the requested capability structure within the
225  * device's PCI configuration space or 0 in case the device does not
226  * support it.  Possible values for @cap:
227  *
228  *  %PCI_CAP_ID_PM           Power Management
229  *  %PCI_CAP_ID_AGP          Accelerated Graphics Port
230  *  %PCI_CAP_ID_VPD          Vital Product Data
231  *  %PCI_CAP_ID_SLOTID       Slot Identification
232  *  %PCI_CAP_ID_MSI          Message Signalled Interrupts
233  *  %PCI_CAP_ID_CHSWP        CompactPCI HotSwap
234  *  %PCI_CAP_ID_PCIX         PCI-X
235  *  %PCI_CAP_ID_EXP          PCI Express
236  */
237 int pci_find_capability(struct pci_dev *dev, int cap)
238 {
239         int pos;
240
241         pos = __pci_bus_find_cap_start(dev->bus, dev->devfn, dev->hdr_type);
242         if (pos)
243                 pos = __pci_find_next_cap(dev->bus, dev->devfn, pos, cap);
244
245         return pos;
246 }
247 EXPORT_SYMBOL(pci_find_capability);
248
249 /**
250  * pci_bus_find_capability - query for devices' capabilities
251  * @bus:   the PCI bus to query
252  * @devfn: PCI device to query
253  * @cap:   capability code
254  *
255  * Like pci_find_capability() but works for pci devices that do not have a
256  * pci_dev structure set up yet.
257  *
258  * Returns the address of the requested capability structure within the
259  * device's PCI configuration space or 0 in case the device does not
260  * support it.
261  */
262 int pci_bus_find_capability(struct pci_bus *bus, unsigned int devfn, int cap)
263 {
264         int pos;
265         u8 hdr_type;
266
267         pci_bus_read_config_byte(bus, devfn, PCI_HEADER_TYPE, &hdr_type);
268
269         pos = __pci_bus_find_cap_start(bus, devfn, hdr_type & 0x7f);
270         if (pos)
271                 pos = __pci_find_next_cap(bus, devfn, pos, cap);
272
273         return pos;
274 }
275 EXPORT_SYMBOL(pci_bus_find_capability);
276
277 /**
278  * pci_find_next_ext_capability - Find an extended capability
279  * @dev: PCI device to query
280  * @start: address at which to start looking (0 to start at beginning of list)
281  * @cap: capability code
282  *
283  * Returns the address of the next matching extended capability structure
284  * within the device's PCI configuration space or 0 if the device does
285  * not support it.  Some capabilities can occur several times, e.g., the
286  * vendor-specific capability, and this provides a way to find them all.
287  */
288 int pci_find_next_ext_capability(struct pci_dev *dev, int start, int cap)
289 {
290         u32 header;
291         int ttl;
292         int pos = PCI_CFG_SPACE_SIZE;
293
294         /* minimum 8 bytes per capability */
295         ttl = (PCI_CFG_SPACE_EXP_SIZE - PCI_CFG_SPACE_SIZE) / 8;
296
297         if (dev->cfg_size <= PCI_CFG_SPACE_SIZE)
298                 return 0;
299
300         if (start)
301                 pos = start;
302
303         if (pci_read_config_dword(dev, pos, &header) != PCIBIOS_SUCCESSFUL)
304                 return 0;
305
306         /*
307          * If we have no capabilities, this is indicated by cap ID,
308          * cap version and next pointer all being 0.
309          */
310         if (header == 0)
311                 return 0;
312
313         while (ttl-- > 0) {
314                 if (PCI_EXT_CAP_ID(header) == cap && pos != start)
315                         return pos;
316
317                 pos = PCI_EXT_CAP_NEXT(header);
318                 if (pos < PCI_CFG_SPACE_SIZE)
319                         break;
320
321                 if (pci_read_config_dword(dev, pos, &header) != PCIBIOS_SUCCESSFUL)
322                         break;
323         }
324
325         return 0;
326 }
327 EXPORT_SYMBOL_GPL(pci_find_next_ext_capability);
328
329 /**
330  * pci_find_ext_capability - Find an extended capability
331  * @dev: PCI device to query
332  * @cap: capability code
333  *
334  * Returns the address of the requested extended capability structure
335  * within the device's PCI configuration space or 0 if the device does
336  * not support it.  Possible values for @cap:
337  *
338  *  %PCI_EXT_CAP_ID_ERR         Advanced Error Reporting
339  *  %PCI_EXT_CAP_ID_VC          Virtual Channel
340  *  %PCI_EXT_CAP_ID_DSN         Device Serial Number
341  *  %PCI_EXT_CAP_ID_PWR         Power Budgeting
342  */
343 int pci_find_ext_capability(struct pci_dev *dev, int cap)
344 {
345         return pci_find_next_ext_capability(dev, 0, cap);
346 }
347 EXPORT_SYMBOL_GPL(pci_find_ext_capability);
348
349 static int __pci_find_next_ht_cap(struct pci_dev *dev, int pos, int ht_cap)
350 {
351         int rc, ttl = PCI_FIND_CAP_TTL;
352         u8 cap, mask;
353
354         if (ht_cap == HT_CAPTYPE_SLAVE || ht_cap == HT_CAPTYPE_HOST)
355                 mask = HT_3BIT_CAP_MASK;
356         else
357                 mask = HT_5BIT_CAP_MASK;
358
359         pos = __pci_find_next_cap_ttl(dev->bus, dev->devfn, pos,
360                                       PCI_CAP_ID_HT, &ttl);
361         while (pos) {
362                 rc = pci_read_config_byte(dev, pos + 3, &cap);
363                 if (rc != PCIBIOS_SUCCESSFUL)
364                         return 0;
365
366                 if ((cap & mask) == ht_cap)
367                         return pos;
368
369                 pos = __pci_find_next_cap_ttl(dev->bus, dev->devfn,
370                                               pos + PCI_CAP_LIST_NEXT,
371                                               PCI_CAP_ID_HT, &ttl);
372         }
373
374         return 0;
375 }
376 /**
377  * pci_find_next_ht_capability - query a device's Hypertransport capabilities
378  * @dev: PCI device to query
379  * @pos: Position from which to continue searching
380  * @ht_cap: Hypertransport capability code
381  *
382  * To be used in conjunction with pci_find_ht_capability() to search for
383  * all capabilities matching @ht_cap. @pos should always be a value returned
384  * from pci_find_ht_capability().
385  *
386  * NB. To be 100% safe against broken PCI devices, the caller should take
387  * steps to avoid an infinite loop.
388  */
389 int pci_find_next_ht_capability(struct pci_dev *dev, int pos, int ht_cap)
390 {
391         return __pci_find_next_ht_cap(dev, pos + PCI_CAP_LIST_NEXT, ht_cap);
392 }
393 EXPORT_SYMBOL_GPL(pci_find_next_ht_capability);
394
395 /**
396  * pci_find_ht_capability - query a device's Hypertransport capabilities
397  * @dev: PCI device to query
398  * @ht_cap: Hypertransport capability code
399  *
400  * Tell if a device supports a given Hypertransport capability.
401  * Returns an address within the device's PCI configuration space
402  * or 0 in case the device does not support the request capability.
403  * The address points to the PCI capability, of type PCI_CAP_ID_HT,
404  * which has a Hypertransport capability matching @ht_cap.
405  */
406 int pci_find_ht_capability(struct pci_dev *dev, int ht_cap)
407 {
408         int pos;
409
410         pos = __pci_bus_find_cap_start(dev->bus, dev->devfn, dev->hdr_type);
411         if (pos)
412                 pos = __pci_find_next_ht_cap(dev, pos, ht_cap);
413
414         return pos;
415 }
416 EXPORT_SYMBOL_GPL(pci_find_ht_capability);
417
418 /**
419  * pci_find_parent_resource - return resource region of parent bus of given region
420  * @dev: PCI device structure contains resources to be searched
421  * @res: child resource record for which parent is sought
422  *
423  *  For given resource region of given device, return the resource
424  *  region of parent bus the given region is contained in.
425  */
426 struct resource *pci_find_parent_resource(const struct pci_dev *dev,
427                                           struct resource *res)
428 {
429         const struct pci_bus *bus = dev->bus;
430         struct resource *r;
431         int i;
432
433         pci_bus_for_each_resource(bus, r, i) {
434                 if (!r)
435                         continue;
436                 if (res->start && resource_contains(r, res)) {
437
438                         /*
439                          * If the window is prefetchable but the BAR is
440                          * not, the allocator made a mistake.
441                          */
442                         if (r->flags & IORESOURCE_PREFETCH &&
443                             !(res->flags & IORESOURCE_PREFETCH))
444                                 return NULL;
445
446                         /*
447                          * If we're below a transparent bridge, there may
448                          * be both a positively-decoded aperture and a
449                          * subtractively-decoded region that contain the BAR.
450                          * We want the positively-decoded one, so this depends
451                          * on pci_bus_for_each_resource() giving us those
452                          * first.
453                          */
454                         return r;
455                 }
456         }
457         return NULL;
458 }
459 EXPORT_SYMBOL(pci_find_parent_resource);
460
461 /**
462  * pci_wait_for_pending - wait for @mask bit(s) to clear in status word @pos
463  * @dev: the PCI device to operate on
464  * @pos: config space offset of status word
465  * @mask: mask of bit(s) to care about in status word
466  *
467  * Return 1 when mask bit(s) in status word clear, 0 otherwise.
468  */
469 int pci_wait_for_pending(struct pci_dev *dev, int pos, u16 mask)
470 {
471         int i;
472
473         /* Wait for Transaction Pending bit clean */
474         for (i = 0; i < 4; i++) {
475                 u16 status;
476                 if (i)
477                         msleep((1 << (i - 1)) * 100);
478
479                 pci_read_config_word(dev, pos, &status);
480                 if (!(status & mask))
481                         return 1;
482         }
483
484         return 0;
485 }
486
487 /**
488  * pci_restore_bars - restore a devices BAR values (e.g. after wake-up)
489  * @dev: PCI device to have its BARs restored
490  *
491  * Restore the BAR values for a given device, so as to make it
492  * accessible by its driver.
493  */
494 static void pci_restore_bars(struct pci_dev *dev)
495 {
496         int i;
497
498         for (i = 0; i < PCI_BRIDGE_RESOURCES; i++)
499                 pci_update_resource(dev, i);
500 }
501
502 static struct pci_platform_pm_ops *pci_platform_pm;
503
504 int pci_set_platform_pm(struct pci_platform_pm_ops *ops)
505 {
506         if (!ops->is_manageable || !ops->set_state || !ops->choose_state
507             || !ops->sleep_wake)
508                 return -EINVAL;
509         pci_platform_pm = ops;
510         return 0;
511 }
512
513 static inline bool platform_pci_power_manageable(struct pci_dev *dev)
514 {
515         return pci_platform_pm ? pci_platform_pm->is_manageable(dev) : false;
516 }
517
518 static inline int platform_pci_set_power_state(struct pci_dev *dev,
519                                                pci_power_t t)
520 {
521         return pci_platform_pm ? pci_platform_pm->set_state(dev, t) : -ENOSYS;
522 }
523
524 static inline pci_power_t platform_pci_choose_state(struct pci_dev *dev)
525 {
526         return pci_platform_pm ?
527                         pci_platform_pm->choose_state(dev) : PCI_POWER_ERROR;
528 }
529
530 static inline int platform_pci_sleep_wake(struct pci_dev *dev, bool enable)
531 {
532         return pci_platform_pm ?
533                         pci_platform_pm->sleep_wake(dev, enable) : -ENODEV;
534 }
535
536 static inline int platform_pci_run_wake(struct pci_dev *dev, bool enable)
537 {
538         return pci_platform_pm ?
539                         pci_platform_pm->run_wake(dev, enable) : -ENODEV;
540 }
541
542 static inline bool platform_pci_need_resume(struct pci_dev *dev)
543 {
544         return pci_platform_pm ? pci_platform_pm->need_resume(dev) : false;
545 }
546
547 /**
548  * pci_raw_set_power_state - Use PCI PM registers to set the power state of
549  *                           given PCI device
550  * @dev: PCI device to handle.
551  * @state: PCI power state (D0, D1, D2, D3hot) to put the device into.
552  *
553  * RETURN VALUE:
554  * -EINVAL if the requested state is invalid.
555  * -EIO if device does not support PCI PM or its PM capabilities register has a
556  * wrong version, or device doesn't support the requested state.
557  * 0 if device already is in the requested state.
558  * 0 if device's power state has been successfully changed.
559  */
560 static int pci_raw_set_power_state(struct pci_dev *dev, pci_power_t state)
561 {
562         u16 pmcsr;
563         bool need_restore = false;
564
565         /* Check if we're already there */
566         if (dev->current_state == state)
567                 return 0;
568
569         if (!dev->pm_cap)
570                 return -EIO;
571
572         if (state < PCI_D0 || state > PCI_D3hot)
573                 return -EINVAL;
574
575         /* Validate current state:
576          * Can enter D0 from any state, but if we can only go deeper
577          * to sleep if we're already in a low power state
578          */
579         if (state != PCI_D0 && dev->current_state <= PCI_D3cold
580             && dev->current_state > state) {
581                 dev_err(&dev->dev, "invalid power transition (from state %d to %d)\n",
582                         dev->current_state, state);
583                 return -EINVAL;
584         }
585
586         /* check if this device supports the desired state */
587         if ((state == PCI_D1 && !dev->d1_support)
588            || (state == PCI_D2 && !dev->d2_support))
589                 return -EIO;
590
591         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
592
593         /* If we're (effectively) in D3, force entire word to 0.
594          * This doesn't affect PME_Status, disables PME_En, and
595          * sets PowerState to 0.
596          */
597         switch (dev->current_state) {
598         case PCI_D0:
599         case PCI_D1:
600         case PCI_D2:
601                 pmcsr &= ~PCI_PM_CTRL_STATE_MASK;
602                 pmcsr |= state;
603                 break;
604         case PCI_D3hot:
605         case PCI_D3cold:
606         case PCI_UNKNOWN: /* Boot-up */
607                 if ((pmcsr & PCI_PM_CTRL_STATE_MASK) == PCI_D3hot
608                  && !(pmcsr & PCI_PM_CTRL_NO_SOFT_RESET))
609                         need_restore = true;
610                 /* Fall-through: force to D0 */
611         default:
612                 pmcsr = 0;
613                 break;
614         }
615
616         /* enter specified state */
617         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, pmcsr);
618
619         /* Mandatory power management transition delays */
620         /* see PCI PM 1.1 5.6.1 table 18 */
621         if (state == PCI_D3hot || dev->current_state == PCI_D3hot)
622                 pci_dev_d3_sleep(dev);
623         else if (state == PCI_D2 || dev->current_state == PCI_D2)
624                 udelay(PCI_PM_D2_DELAY);
625
626         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
627         dev->current_state = (pmcsr & PCI_PM_CTRL_STATE_MASK);
628         if (dev->current_state != state && printk_ratelimit())
629                 dev_info(&dev->dev, "Refused to change power state, currently in D%d\n",
630                          dev->current_state);
631
632         /*
633          * According to section 5.4.1 of the "PCI BUS POWER MANAGEMENT
634          * INTERFACE SPECIFICATION, REV. 1.2", a device transitioning
635          * from D3hot to D0 _may_ perform an internal reset, thereby
636          * going to "D0 Uninitialized" rather than "D0 Initialized".
637          * For example, at least some versions of the 3c905B and the
638          * 3c556B exhibit this behaviour.
639          *
640          * At least some laptop BIOSen (e.g. the Thinkpad T21) leave
641          * devices in a D3hot state at boot.  Consequently, we need to
642          * restore at least the BARs so that the device will be
643          * accessible to its driver.
644          */
645         if (need_restore)
646                 pci_restore_bars(dev);
647
648         if (dev->bus->self)
649                 pcie_aspm_pm_state_change(dev->bus->self);
650
651         return 0;
652 }
653
654 /**
655  * pci_update_current_state - Read PCI power state of given device from its
656  *                            PCI PM registers and cache it
657  * @dev: PCI device to handle.
658  * @state: State to cache in case the device doesn't have the PM capability
659  */
660 void pci_update_current_state(struct pci_dev *dev, pci_power_t state)
661 {
662         if (dev->pm_cap) {
663                 u16 pmcsr;
664
665                 /*
666                  * Configuration space is not accessible for device in
667                  * D3cold, so just keep or set D3cold for safety
668                  */
669                 if (dev->current_state == PCI_D3cold)
670                         return;
671                 if (state == PCI_D3cold) {
672                         dev->current_state = PCI_D3cold;
673                         return;
674                 }
675                 pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
676                 dev->current_state = (pmcsr & PCI_PM_CTRL_STATE_MASK);
677         } else {
678                 dev->current_state = state;
679         }
680 }
681
682 /**
683  * pci_power_up - Put the given device into D0 forcibly
684  * @dev: PCI device to power up
685  */
686 void pci_power_up(struct pci_dev *dev)
687 {
688         if (platform_pci_power_manageable(dev))
689                 platform_pci_set_power_state(dev, PCI_D0);
690
691         pci_raw_set_power_state(dev, PCI_D0);
692         pci_update_current_state(dev, PCI_D0);
693 }
694
695 /**
696  * pci_platform_power_transition - Use platform to change device power state
697  * @dev: PCI device to handle.
698  * @state: State to put the device into.
699  */
700 static int pci_platform_power_transition(struct pci_dev *dev, pci_power_t state)
701 {
702         int error;
703
704         if (platform_pci_power_manageable(dev)) {
705                 error = platform_pci_set_power_state(dev, state);
706                 if (!error)
707                         pci_update_current_state(dev, state);
708         } else
709                 error = -ENODEV;
710
711         if (error && !dev->pm_cap) /* Fall back to PCI_D0 */
712                 dev->current_state = PCI_D0;
713
714         return error;
715 }
716
717 /**
718  * pci_wakeup - Wake up a PCI device
719  * @pci_dev: Device to handle.
720  * @ign: ignored parameter
721  */
722 static int pci_wakeup(struct pci_dev *pci_dev, void *ign)
723 {
724         pci_wakeup_event(pci_dev);
725         pm_request_resume(&pci_dev->dev);
726         return 0;
727 }
728
729 /**
730  * pci_wakeup_bus - Walk given bus and wake up devices on it
731  * @bus: Top bus of the subtree to walk.
732  */
733 static void pci_wakeup_bus(struct pci_bus *bus)
734 {
735         if (bus)
736                 pci_walk_bus(bus, pci_wakeup, NULL);
737 }
738
739 /**
740  * __pci_start_power_transition - Start power transition of a PCI device
741  * @dev: PCI device to handle.
742  * @state: State to put the device into.
743  */
744 static void __pci_start_power_transition(struct pci_dev *dev, pci_power_t state)
745 {
746         if (state == PCI_D0) {
747                 pci_platform_power_transition(dev, PCI_D0);
748                 /*
749                  * Mandatory power management transition delays, see
750                  * PCI Express Base Specification Revision 2.0 Section
751                  * 6.6.1: Conventional Reset.  Do not delay for
752                  * devices powered on/off by corresponding bridge,
753                  * because have already delayed for the bridge.
754                  */
755                 if (dev->runtime_d3cold) {
756                         msleep(dev->d3cold_delay);
757                         /*
758                          * When powering on a bridge from D3cold, the
759                          * whole hierarchy may be powered on into
760                          * D0uninitialized state, resume them to give
761                          * them a chance to suspend again
762                          */
763                         pci_wakeup_bus(dev->subordinate);
764                 }
765         }
766 }
767
768 /**
769  * __pci_dev_set_current_state - Set current state of a PCI device
770  * @dev: Device to handle
771  * @data: pointer to state to be set
772  */
773 static int __pci_dev_set_current_state(struct pci_dev *dev, void *data)
774 {
775         pci_power_t state = *(pci_power_t *)data;
776
777         dev->current_state = state;
778         return 0;
779 }
780
781 /**
782  * __pci_bus_set_current_state - Walk given bus and set current state of devices
783  * @bus: Top bus of the subtree to walk.
784  * @state: state to be set
785  */
786 static void __pci_bus_set_current_state(struct pci_bus *bus, pci_power_t state)
787 {
788         if (bus)
789                 pci_walk_bus(bus, __pci_dev_set_current_state, &state);
790 }
791
792 /**
793  * __pci_complete_power_transition - Complete power transition of a PCI device
794  * @dev: PCI device to handle.
795  * @state: State to put the device into.
796  *
797  * This function should not be called directly by device drivers.
798  */
799 int __pci_complete_power_transition(struct pci_dev *dev, pci_power_t state)
800 {
801         int ret;
802
803         if (state <= PCI_D0)
804                 return -EINVAL;
805         ret = pci_platform_power_transition(dev, state);
806         /* Power off the bridge may power off the whole hierarchy */
807         if (!ret && state == PCI_D3cold)
808                 __pci_bus_set_current_state(dev->subordinate, PCI_D3cold);
809         return ret;
810 }
811 EXPORT_SYMBOL_GPL(__pci_complete_power_transition);
812
813 /**
814  * pci_set_power_state - Set the power state of a PCI device
815  * @dev: PCI device to handle.
816  * @state: PCI power state (D0, D1, D2, D3hot) to put the device into.
817  *
818  * Transition a device to a new power state, using the platform firmware and/or
819  * the device's PCI PM registers.
820  *
821  * RETURN VALUE:
822  * -EINVAL if the requested state is invalid.
823  * -EIO if device does not support PCI PM or its PM capabilities register has a
824  * wrong version, or device doesn't support the requested state.
825  * 0 if device already is in the requested state.
826  * 0 if device's power state has been successfully changed.
827  */
828 int pci_set_power_state(struct pci_dev *dev, pci_power_t state)
829 {
830         int error;
831
832         /* bound the state we're entering */
833         if (state > PCI_D3cold)
834                 state = PCI_D3cold;
835         else if (state < PCI_D0)
836                 state = PCI_D0;
837         else if ((state == PCI_D1 || state == PCI_D2) && pci_no_d1d2(dev))
838                 /*
839                  * If the device or the parent bridge do not support PCI PM,
840                  * ignore the request if we're doing anything other than putting
841                  * it into D0 (which would only happen on boot).
842                  */
843                 return 0;
844
845         /* Check if we're already there */
846         if (dev->current_state == state)
847                 return 0;
848
849         __pci_start_power_transition(dev, state);
850
851         /* This device is quirked not to be put into D3, so
852            don't put it in D3 */
853         if (state >= PCI_D3hot && (dev->dev_flags & PCI_DEV_FLAGS_NO_D3))
854                 return 0;
855
856         /*
857          * To put device in D3cold, we put device into D3hot in native
858          * way, then put device into D3cold with platform ops
859          */
860         error = pci_raw_set_power_state(dev, state > PCI_D3hot ?
861                                         PCI_D3hot : state);
862
863         if (!__pci_complete_power_transition(dev, state))
864                 error = 0;
865
866         return error;
867 }
868 EXPORT_SYMBOL(pci_set_power_state);
869
870 /**
871  * pci_choose_state - Choose the power state of a PCI device
872  * @dev: PCI device to be suspended
873  * @state: target sleep state for the whole system. This is the value
874  *      that is passed to suspend() function.
875  *
876  * Returns PCI power state suitable for given device and given system
877  * message.
878  */
879
880 pci_power_t pci_choose_state(struct pci_dev *dev, pm_message_t state)
881 {
882         pci_power_t ret;
883
884         if (!dev->pm_cap)
885                 return PCI_D0;
886
887         ret = platform_pci_choose_state(dev);
888         if (ret != PCI_POWER_ERROR)
889                 return ret;
890
891         switch (state.event) {
892         case PM_EVENT_ON:
893                 return PCI_D0;
894         case PM_EVENT_FREEZE:
895         case PM_EVENT_PRETHAW:
896                 /* REVISIT both freeze and pre-thaw "should" use D0 */
897         case PM_EVENT_SUSPEND:
898         case PM_EVENT_HIBERNATE:
899                 return PCI_D3hot;
900         default:
901                 dev_info(&dev->dev, "unrecognized suspend event %d\n",
902                          state.event);
903                 BUG();
904         }
905         return PCI_D0;
906 }
907 EXPORT_SYMBOL(pci_choose_state);
908
909 #define PCI_EXP_SAVE_REGS       7
910
911 static struct pci_cap_saved_state *_pci_find_saved_cap(struct pci_dev *pci_dev,
912                                                        u16 cap, bool extended)
913 {
914         struct pci_cap_saved_state *tmp;
915
916         hlist_for_each_entry(tmp, &pci_dev->saved_cap_space, next) {
917                 if (tmp->cap.cap_extended == extended && tmp->cap.cap_nr == cap)
918                         return tmp;
919         }
920         return NULL;
921 }
922
923 struct pci_cap_saved_state *pci_find_saved_cap(struct pci_dev *dev, char cap)
924 {
925         return _pci_find_saved_cap(dev, cap, false);
926 }
927
928 struct pci_cap_saved_state *pci_find_saved_ext_cap(struct pci_dev *dev, u16 cap)
929 {
930         return _pci_find_saved_cap(dev, cap, true);
931 }
932
933 static int pci_save_pcie_state(struct pci_dev *dev)
934 {
935         int i = 0;
936         struct pci_cap_saved_state *save_state;
937         u16 *cap;
938
939         if (!pci_is_pcie(dev))
940                 return 0;
941
942         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_EXP);
943         if (!save_state) {
944                 dev_err(&dev->dev, "buffer not found in %s\n", __func__);
945                 return -ENOMEM;
946         }
947
948         cap = (u16 *)&save_state->cap.data[0];
949         pcie_capability_read_word(dev, PCI_EXP_DEVCTL, &cap[i++]);
950         pcie_capability_read_word(dev, PCI_EXP_LNKCTL, &cap[i++]);
951         pcie_capability_read_word(dev, PCI_EXP_SLTCTL, &cap[i++]);
952         pcie_capability_read_word(dev, PCI_EXP_RTCTL,  &cap[i++]);
953         pcie_capability_read_word(dev, PCI_EXP_DEVCTL2, &cap[i++]);
954         pcie_capability_read_word(dev, PCI_EXP_LNKCTL2, &cap[i++]);
955         pcie_capability_read_word(dev, PCI_EXP_SLTCTL2, &cap[i++]);
956
957         return 0;
958 }
959
960 static void pci_restore_pcie_state(struct pci_dev *dev)
961 {
962         int i = 0;
963         struct pci_cap_saved_state *save_state;
964         u16 *cap;
965
966         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_EXP);
967         if (!save_state)
968                 return;
969
970         cap = (u16 *)&save_state->cap.data[0];
971         pcie_capability_write_word(dev, PCI_EXP_DEVCTL, cap[i++]);
972         pcie_capability_write_word(dev, PCI_EXP_LNKCTL, cap[i++]);
973         pcie_capability_write_word(dev, PCI_EXP_SLTCTL, cap[i++]);
974         pcie_capability_write_word(dev, PCI_EXP_RTCTL, cap[i++]);
975         pcie_capability_write_word(dev, PCI_EXP_DEVCTL2, cap[i++]);
976         pcie_capability_write_word(dev, PCI_EXP_LNKCTL2, cap[i++]);
977         pcie_capability_write_word(dev, PCI_EXP_SLTCTL2, cap[i++]);
978 }
979
980
981 static int pci_save_pcix_state(struct pci_dev *dev)
982 {
983         int pos;
984         struct pci_cap_saved_state *save_state;
985
986         pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
987         if (!pos)
988                 return 0;
989
990         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_PCIX);
991         if (!save_state) {
992                 dev_err(&dev->dev, "buffer not found in %s\n", __func__);
993                 return -ENOMEM;
994         }
995
996         pci_read_config_word(dev, pos + PCI_X_CMD,
997                              (u16 *)save_state->cap.data);
998
999         return 0;
1000 }
1001
1002 static void pci_restore_pcix_state(struct pci_dev *dev)
1003 {
1004         int i = 0, pos;
1005         struct pci_cap_saved_state *save_state;
1006         u16 *cap;
1007
1008         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_PCIX);
1009         pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
1010         if (!save_state || !pos)
1011                 return;
1012         cap = (u16 *)&save_state->cap.data[0];
1013
1014         pci_write_config_word(dev, pos + PCI_X_CMD, cap[i++]);
1015 }
1016
1017
1018 /**
1019  * pci_save_state - save the PCI configuration space of a device before suspending
1020  * @dev: - PCI device that we're dealing with
1021  */
1022 int pci_save_state(struct pci_dev *dev)
1023 {
1024         int i;
1025         /* XXX: 100% dword access ok here? */
1026         for (i = 0; i < 16; i++)
1027                 pci_read_config_dword(dev, i * 4, &dev->saved_config_space[i]);
1028         dev->state_saved = true;
1029
1030         i = pci_save_pcie_state(dev);
1031         if (i != 0)
1032                 return i;
1033
1034         i = pci_save_pcix_state(dev);
1035         if (i != 0)
1036                 return i;
1037
1038         return pci_save_vc_state(dev);
1039 }
1040 EXPORT_SYMBOL(pci_save_state);
1041
1042 static void pci_restore_config_dword(struct pci_dev *pdev, int offset,
1043                                      u32 saved_val, int retry)
1044 {
1045         u32 val;
1046
1047         pci_read_config_dword(pdev, offset, &val);
1048         if (val == saved_val)
1049                 return;
1050
1051         for (;;) {
1052                 dev_dbg(&pdev->dev, "restoring config space at offset %#x (was %#x, writing %#x)\n",
1053                         offset, val, saved_val);
1054                 pci_write_config_dword(pdev, offset, saved_val);
1055                 if (retry-- <= 0)
1056                         return;
1057
1058                 pci_read_config_dword(pdev, offset, &val);
1059                 if (val == saved_val)
1060                         return;
1061
1062                 mdelay(1);
1063         }
1064 }
1065
1066 static void pci_restore_config_space_range(struct pci_dev *pdev,
1067                                            int start, int end, int retry)
1068 {
1069         int index;
1070
1071         for (index = end; index >= start; index--)
1072                 pci_restore_config_dword(pdev, 4 * index,
1073                                          pdev->saved_config_space[index],
1074                                          retry);
1075 }
1076
1077 static void pci_restore_config_space(struct pci_dev *pdev)
1078 {
1079         if (pdev->hdr_type == PCI_HEADER_TYPE_NORMAL) {
1080                 pci_restore_config_space_range(pdev, 10, 15, 0);
1081                 /* Restore BARs before the command register. */
1082                 pci_restore_config_space_range(pdev, 4, 9, 10);
1083                 pci_restore_config_space_range(pdev, 0, 3, 0);
1084         } else {
1085                 pci_restore_config_space_range(pdev, 0, 15, 0);
1086         }
1087 }
1088
1089 /**
1090  * pci_restore_state - Restore the saved state of a PCI device
1091  * @dev: - PCI device that we're dealing with
1092  */
1093 void pci_restore_state(struct pci_dev *dev)
1094 {
1095         if (!dev->state_saved)
1096                 return;
1097
1098         /* PCI Express register must be restored first */
1099         pci_restore_pcie_state(dev);
1100         pci_restore_ats_state(dev);
1101         pci_restore_vc_state(dev);
1102
1103         pci_cleanup_aer_error_status_regs(dev);
1104
1105         pci_restore_config_space(dev);
1106
1107         pci_restore_pcix_state(dev);
1108         pci_restore_msi_state(dev);
1109
1110         /* Restore ACS and IOV configuration state */
1111         pci_enable_acs(dev);
1112         pci_restore_iov_state(dev);
1113
1114         dev->state_saved = false;
1115 }
1116 EXPORT_SYMBOL(pci_restore_state);
1117
1118 struct pci_saved_state {
1119         u32 config_space[16];
1120         struct pci_cap_saved_data cap[0];
1121 };
1122
1123 /**
1124  * pci_store_saved_state - Allocate and return an opaque struct containing
1125  *                         the device saved state.
1126  * @dev: PCI device that we're dealing with
1127  *
1128  * Return NULL if no state or error.
1129  */
1130 struct pci_saved_state *pci_store_saved_state(struct pci_dev *dev)
1131 {
1132         struct pci_saved_state *state;
1133         struct pci_cap_saved_state *tmp;
1134         struct pci_cap_saved_data *cap;
1135         size_t size;
1136
1137         if (!dev->state_saved)
1138                 return NULL;
1139
1140         size = sizeof(*state) + sizeof(struct pci_cap_saved_data);
1141
1142         hlist_for_each_entry(tmp, &dev->saved_cap_space, next)
1143                 size += sizeof(struct pci_cap_saved_data) + tmp->cap.size;
1144
1145         state = kzalloc(size, GFP_KERNEL);
1146         if (!state)
1147                 return NULL;
1148
1149         memcpy(state->config_space, dev->saved_config_space,
1150                sizeof(state->config_space));
1151
1152         cap = state->cap;
1153         hlist_for_each_entry(tmp, &dev->saved_cap_space, next) {
1154                 size_t len = sizeof(struct pci_cap_saved_data) + tmp->cap.size;
1155                 memcpy(cap, &tmp->cap, len);
1156                 cap = (struct pci_cap_saved_data *)((u8 *)cap + len);
1157         }
1158         /* Empty cap_save terminates list */
1159
1160         return state;
1161 }
1162 EXPORT_SYMBOL_GPL(pci_store_saved_state);
1163
1164 /**
1165  * pci_load_saved_state - Reload the provided save state into struct pci_dev.
1166  * @dev: PCI device that we're dealing with
1167  * @state: Saved state returned from pci_store_saved_state()
1168  */
1169 int pci_load_saved_state(struct pci_dev *dev,
1170                          struct pci_saved_state *state)
1171 {
1172         struct pci_cap_saved_data *cap;
1173
1174         dev->state_saved = false;
1175
1176         if (!state)
1177                 return 0;
1178
1179         memcpy(dev->saved_config_space, state->config_space,
1180                sizeof(state->config_space));
1181
1182         cap = state->cap;
1183         while (cap->size) {
1184                 struct pci_cap_saved_state *tmp;
1185
1186                 tmp = _pci_find_saved_cap(dev, cap->cap_nr, cap->cap_extended);
1187                 if (!tmp || tmp->cap.size != cap->size)
1188                         return -EINVAL;
1189
1190                 memcpy(tmp->cap.data, cap->data, tmp->cap.size);
1191                 cap = (struct pci_cap_saved_data *)((u8 *)cap +
1192                        sizeof(struct pci_cap_saved_data) + cap->size);
1193         }
1194
1195         dev->state_saved = true;
1196         return 0;
1197 }
1198 EXPORT_SYMBOL_GPL(pci_load_saved_state);
1199
1200 /**
1201  * pci_load_and_free_saved_state - Reload the save state pointed to by state,
1202  *                                 and free the memory allocated for it.
1203  * @dev: PCI device that we're dealing with
1204  * @state: Pointer to saved state returned from pci_store_saved_state()
1205  */
1206 int pci_load_and_free_saved_state(struct pci_dev *dev,
1207                                   struct pci_saved_state **state)
1208 {
1209         int ret = pci_load_saved_state(dev, *state);
1210         kfree(*state);
1211         *state = NULL;
1212         return ret;
1213 }
1214 EXPORT_SYMBOL_GPL(pci_load_and_free_saved_state);
1215
1216 int __weak pcibios_enable_device(struct pci_dev *dev, int bars)
1217 {
1218         return pci_enable_resources(dev, bars);
1219 }
1220
1221 static int do_pci_enable_device(struct pci_dev *dev, int bars)
1222 {
1223         int err;
1224         struct pci_dev *bridge;
1225         u16 cmd;
1226         u8 pin;
1227
1228         err = pci_set_power_state(dev, PCI_D0);
1229         if (err < 0 && err != -EIO)
1230                 return err;
1231
1232         bridge = pci_upstream_bridge(dev);
1233         if (bridge)
1234                 pcie_aspm_powersave_config_link(bridge);
1235
1236         err = pcibios_enable_device(dev, bars);
1237         if (err < 0)
1238                 return err;
1239         pci_fixup_device(pci_fixup_enable, dev);
1240
1241         if (dev->msi_enabled || dev->msix_enabled)
1242                 return 0;
1243
1244         pci_read_config_byte(dev, PCI_INTERRUPT_PIN, &pin);
1245         if (pin) {
1246                 pci_read_config_word(dev, PCI_COMMAND, &cmd);
1247                 if (cmd & PCI_COMMAND_INTX_DISABLE)
1248                         pci_write_config_word(dev, PCI_COMMAND,
1249                                               cmd & ~PCI_COMMAND_INTX_DISABLE);
1250         }
1251
1252         return 0;
1253 }
1254
1255 /**
1256  * pci_reenable_device - Resume abandoned device
1257  * @dev: PCI device to be resumed
1258  *
1259  *  Note this function is a backend of pci_default_resume and is not supposed
1260  *  to be called by normal code, write proper resume handler and use it instead.
1261  */
1262 int pci_reenable_device(struct pci_dev *dev)
1263 {
1264         if (pci_is_enabled(dev))
1265                 return do_pci_enable_device(dev, (1 << PCI_NUM_RESOURCES) - 1);
1266         return 0;
1267 }
1268 EXPORT_SYMBOL(pci_reenable_device);
1269
1270 static void pci_enable_bridge(struct pci_dev *dev)
1271 {
1272         struct pci_dev *bridge;
1273         int retval;
1274
1275         bridge = pci_upstream_bridge(dev);
1276         if (bridge)
1277                 pci_enable_bridge(bridge);
1278
1279         if (pci_is_enabled(dev)) {
1280                 if (!dev->is_busmaster)
1281                         pci_set_master(dev);
1282                 return;
1283         }
1284
1285         retval = pci_enable_device(dev);
1286         if (retval)
1287                 dev_err(&dev->dev, "Error enabling bridge (%d), continuing\n",
1288                         retval);
1289         pci_set_master(dev);
1290 }
1291
1292 static int pci_enable_device_flags(struct pci_dev *dev, unsigned long flags)
1293 {
1294         struct pci_dev *bridge;
1295         int err;
1296         int i, bars = 0;
1297
1298         /*
1299          * Power state could be unknown at this point, either due to a fresh
1300          * boot or a device removal call.  So get the current power state
1301          * so that things like MSI message writing will behave as expected
1302          * (e.g. if the device really is in D0 at enable time).
1303          */
1304         if (dev->pm_cap) {
1305                 u16 pmcsr;
1306                 pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
1307                 dev->current_state = (pmcsr & PCI_PM_CTRL_STATE_MASK);
1308         }
1309
1310         if (atomic_inc_return(&dev->enable_cnt) > 1)
1311                 return 0;               /* already enabled */
1312
1313         bridge = pci_upstream_bridge(dev);
1314         if (bridge)
1315                 pci_enable_bridge(bridge);
1316
1317         /* only skip sriov related */
1318         for (i = 0; i <= PCI_ROM_RESOURCE; i++)
1319                 if (dev->resource[i].flags & flags)
1320                         bars |= (1 << i);
1321         for (i = PCI_BRIDGE_RESOURCES; i < DEVICE_COUNT_RESOURCE; i++)
1322                 if (dev->resource[i].flags & flags)
1323                         bars |= (1 << i);
1324
1325         err = do_pci_enable_device(dev, bars);
1326         if (err < 0)
1327                 atomic_dec(&dev->enable_cnt);
1328         return err;
1329 }
1330
1331 /**
1332  * pci_enable_device_io - Initialize a device for use with IO space
1333  * @dev: PCI device to be initialized
1334  *
1335  *  Initialize device before it's used by a driver. Ask low-level code
1336  *  to enable I/O resources. Wake up the device if it was suspended.
1337  *  Beware, this function can fail.
1338  */
1339 int pci_enable_device_io(struct pci_dev *dev)
1340 {
1341         return pci_enable_device_flags(dev, IORESOURCE_IO);
1342 }
1343 EXPORT_SYMBOL(pci_enable_device_io);
1344
1345 /**
1346  * pci_enable_device_mem - Initialize a device for use with Memory space
1347  * @dev: PCI device to be initialized
1348  *
1349  *  Initialize device before it's used by a driver. Ask low-level code
1350  *  to enable Memory resources. Wake up the device if it was suspended.
1351  *  Beware, this function can fail.
1352  */
1353 int pci_enable_device_mem(struct pci_dev *dev)
1354 {
1355         return pci_enable_device_flags(dev, IORESOURCE_MEM);
1356 }
1357 EXPORT_SYMBOL(pci_enable_device_mem);
1358
1359 /**
1360  * pci_enable_device - Initialize device before it's used by a driver.
1361  * @dev: PCI device to be initialized
1362  *
1363  *  Initialize device before it's used by a driver. Ask low-level code
1364  *  to enable I/O and memory. Wake up the device if it was suspended.
1365  *  Beware, this function can fail.
1366  *
1367  *  Note we don't actually enable the device many times if we call
1368  *  this function repeatedly (we just increment the count).
1369  */
1370 int pci_enable_device(struct pci_dev *dev)
1371 {
1372         return pci_enable_device_flags(dev, IORESOURCE_MEM | IORESOURCE_IO);
1373 }
1374 EXPORT_SYMBOL(pci_enable_device);
1375
1376 /*
1377  * Managed PCI resources.  This manages device on/off, intx/msi/msix
1378  * on/off and BAR regions.  pci_dev itself records msi/msix status, so
1379  * there's no need to track it separately.  pci_devres is initialized
1380  * when a device is enabled using managed PCI device enable interface.
1381  */
1382 struct pci_devres {
1383         unsigned int enabled:1;
1384         unsigned int pinned:1;
1385         unsigned int orig_intx:1;
1386         unsigned int restore_intx:1;
1387         u32 region_mask;
1388 };
1389
1390 static void pcim_release(struct device *gendev, void *res)
1391 {
1392         struct pci_dev *dev = container_of(gendev, struct pci_dev, dev);
1393         struct pci_devres *this = res;
1394         int i;
1395
1396         if (dev->msi_enabled)
1397                 pci_disable_msi(dev);
1398         if (dev->msix_enabled)
1399                 pci_disable_msix(dev);
1400
1401         for (i = 0; i < DEVICE_COUNT_RESOURCE; i++)
1402                 if (this->region_mask & (1 << i))
1403                         pci_release_region(dev, i);
1404
1405         if (this->restore_intx)
1406                 pci_intx(dev, this->orig_intx);
1407
1408         if (this->enabled && !this->pinned)
1409                 pci_disable_device(dev);
1410 }
1411
1412 static struct pci_devres *get_pci_dr(struct pci_dev *pdev)
1413 {
1414         struct pci_devres *dr, *new_dr;
1415
1416         dr = devres_find(&pdev->dev, pcim_release, NULL, NULL);
1417         if (dr)
1418                 return dr;
1419
1420         new_dr = devres_alloc(pcim_release, sizeof(*new_dr), GFP_KERNEL);
1421         if (!new_dr)
1422                 return NULL;
1423         return devres_get(&pdev->dev, new_dr, NULL, NULL);
1424 }
1425
1426 static struct pci_devres *find_pci_dr(struct pci_dev *pdev)
1427 {
1428         if (pci_is_managed(pdev))
1429                 return devres_find(&pdev->dev, pcim_release, NULL, NULL);
1430         return NULL;
1431 }
1432
1433 /**
1434  * pcim_enable_device - Managed pci_enable_device()
1435  * @pdev: PCI device to be initialized
1436  *
1437  * Managed pci_enable_device().
1438  */
1439 int pcim_enable_device(struct pci_dev *pdev)
1440 {
1441         struct pci_devres *dr;
1442         int rc;
1443
1444         dr = get_pci_dr(pdev);
1445         if (unlikely(!dr))
1446                 return -ENOMEM;
1447         if (dr->enabled)
1448                 return 0;
1449
1450         rc = pci_enable_device(pdev);
1451         if (!rc) {
1452                 pdev->is_managed = 1;
1453                 dr->enabled = 1;
1454         }
1455         return rc;
1456 }
1457 EXPORT_SYMBOL(pcim_enable_device);
1458
1459 /**
1460  * pcim_pin_device - Pin managed PCI device
1461  * @pdev: PCI device to pin
1462  *
1463  * Pin managed PCI device @pdev.  Pinned device won't be disabled on
1464  * driver detach.  @pdev must have been enabled with
1465  * pcim_enable_device().
1466  */
1467 void pcim_pin_device(struct pci_dev *pdev)
1468 {
1469         struct pci_devres *dr;
1470
1471         dr = find_pci_dr(pdev);
1472         WARN_ON(!dr || !dr->enabled);
1473         if (dr)
1474                 dr->pinned = 1;
1475 }
1476 EXPORT_SYMBOL(pcim_pin_device);
1477
1478 /*
1479  * pcibios_add_device - provide arch specific hooks when adding device dev
1480  * @dev: the PCI device being added
1481  *
1482  * Permits the platform to provide architecture specific functionality when
1483  * devices are added. This is the default implementation. Architecture
1484  * implementations can override this.
1485  */
1486 int __weak pcibios_add_device(struct pci_dev *dev)
1487 {
1488         return 0;
1489 }
1490
1491 /**
1492  * pcibios_release_device - provide arch specific hooks when releasing device dev
1493  * @dev: the PCI device being released
1494  *
1495  * Permits the platform to provide architecture specific functionality when
1496  * devices are released. This is the default implementation. Architecture
1497  * implementations can override this.
1498  */
1499 void __weak pcibios_release_device(struct pci_dev *dev) {}
1500
1501 /**
1502  * pcibios_disable_device - disable arch specific PCI resources for device dev
1503  * @dev: the PCI device to disable
1504  *
1505  * Disables architecture specific PCI resources for the device. This
1506  * is the default implementation. Architecture implementations can
1507  * override this.
1508  */
1509 void __weak pcibios_disable_device (struct pci_dev *dev) {}
1510
1511 /**
1512  * pcibios_penalize_isa_irq - penalize an ISA IRQ
1513  * @irq: ISA IRQ to penalize
1514  * @active: IRQ active or not
1515  *
1516  * Permits the platform to provide architecture-specific functionality when
1517  * penalizing ISA IRQs. This is the default implementation. Architecture
1518  * implementations can override this.
1519  */
1520 void __weak pcibios_penalize_isa_irq(int irq, int active) {}
1521
1522 static void do_pci_disable_device(struct pci_dev *dev)
1523 {
1524         u16 pci_command;
1525
1526         pci_read_config_word(dev, PCI_COMMAND, &pci_command);
1527         if (pci_command & PCI_COMMAND_MASTER) {
1528                 pci_command &= ~PCI_COMMAND_MASTER;
1529                 pci_write_config_word(dev, PCI_COMMAND, pci_command);
1530         }
1531
1532         pcibios_disable_device(dev);
1533 }
1534
1535 /**
1536  * pci_disable_enabled_device - Disable device without updating enable_cnt
1537  * @dev: PCI device to disable
1538  *
1539  * NOTE: This function is a backend of PCI power management routines and is
1540  * not supposed to be called drivers.
1541  */
1542 void pci_disable_enabled_device(struct pci_dev *dev)
1543 {
1544         if (pci_is_enabled(dev))
1545                 do_pci_disable_device(dev);
1546 }
1547
1548 /**
1549  * pci_disable_device - Disable PCI device after use
1550  * @dev: PCI device to be disabled
1551  *
1552  * Signal to the system that the PCI device is not in use by the system
1553  * anymore.  This only involves disabling PCI bus-mastering, if active.
1554  *
1555  * Note we don't actually disable the device until all callers of
1556  * pci_enable_device() have called pci_disable_device().
1557  */
1558 void pci_disable_device(struct pci_dev *dev)
1559 {
1560         struct pci_devres *dr;
1561
1562         dr = find_pci_dr(dev);
1563         if (dr)
1564                 dr->enabled = 0;
1565
1566         dev_WARN_ONCE(&dev->dev, atomic_read(&dev->enable_cnt) <= 0,
1567                       "disabling already-disabled device");
1568
1569         if (atomic_dec_return(&dev->enable_cnt) != 0)
1570                 return;
1571
1572         do_pci_disable_device(dev);
1573
1574         dev->is_busmaster = 0;
1575 }
1576 EXPORT_SYMBOL(pci_disable_device);
1577
1578 /**
1579  * pcibios_set_pcie_reset_state - set reset state for device dev
1580  * @dev: the PCIe device reset
1581  * @state: Reset state to enter into
1582  *
1583  *
1584  * Sets the PCIe reset state for the device. This is the default
1585  * implementation. Architecture implementations can override this.
1586  */
1587 int __weak pcibios_set_pcie_reset_state(struct pci_dev *dev,
1588                                         enum pcie_reset_state state)
1589 {
1590         return -EINVAL;
1591 }
1592
1593 /**
1594  * pci_set_pcie_reset_state - set reset state for device dev
1595  * @dev: the PCIe device reset
1596  * @state: Reset state to enter into
1597  *
1598  *
1599  * Sets the PCI reset state for the device.
1600  */
1601 int pci_set_pcie_reset_state(struct pci_dev *dev, enum pcie_reset_state state)
1602 {
1603         return pcibios_set_pcie_reset_state(dev, state);
1604 }
1605 EXPORT_SYMBOL_GPL(pci_set_pcie_reset_state);
1606
1607 /**
1608  * pci_check_pme_status - Check if given device has generated PME.
1609  * @dev: Device to check.
1610  *
1611  * Check the PME status of the device and if set, clear it and clear PME enable
1612  * (if set).  Return 'true' if PME status and PME enable were both set or
1613  * 'false' otherwise.
1614  */
1615 bool pci_check_pme_status(struct pci_dev *dev)
1616 {
1617         int pmcsr_pos;
1618         u16 pmcsr;
1619         bool ret = false;
1620
1621         if (!dev->pm_cap)
1622                 return false;
1623
1624         pmcsr_pos = dev->pm_cap + PCI_PM_CTRL;
1625         pci_read_config_word(dev, pmcsr_pos, &pmcsr);
1626         if (!(pmcsr & PCI_PM_CTRL_PME_STATUS))
1627                 return false;
1628
1629         /* Clear PME status. */
1630         pmcsr |= PCI_PM_CTRL_PME_STATUS;
1631         if (pmcsr & PCI_PM_CTRL_PME_ENABLE) {
1632                 /* Disable PME to avoid interrupt flood. */
1633                 pmcsr &= ~PCI_PM_CTRL_PME_ENABLE;
1634                 ret = true;
1635         }
1636
1637         pci_write_config_word(dev, pmcsr_pos, pmcsr);
1638
1639         return ret;
1640 }
1641
1642 /**
1643  * pci_pme_wakeup - Wake up a PCI device if its PME Status bit is set.
1644  * @dev: Device to handle.
1645  * @pme_poll_reset: Whether or not to reset the device's pme_poll flag.
1646  *
1647  * Check if @dev has generated PME and queue a resume request for it in that
1648  * case.
1649  */
1650 static int pci_pme_wakeup(struct pci_dev *dev, void *pme_poll_reset)
1651 {
1652         if (pme_poll_reset && dev->pme_poll)
1653                 dev->pme_poll = false;
1654
1655         if (pci_check_pme_status(dev)) {
1656                 pci_wakeup_event(dev);
1657                 pm_request_resume(&dev->dev);
1658         }
1659         return 0;
1660 }
1661
1662 /**
1663  * pci_pme_wakeup_bus - Walk given bus and wake up devices on it, if necessary.
1664  * @bus: Top bus of the subtree to walk.
1665  */
1666 void pci_pme_wakeup_bus(struct pci_bus *bus)
1667 {
1668         if (bus)
1669                 pci_walk_bus(bus, pci_pme_wakeup, (void *)true);
1670 }
1671
1672
1673 /**
1674  * pci_pme_capable - check the capability of PCI device to generate PME#
1675  * @dev: PCI device to handle.
1676  * @state: PCI state from which device will issue PME#.
1677  */
1678 bool pci_pme_capable(struct pci_dev *dev, pci_power_t state)
1679 {
1680         if (!dev->pm_cap)
1681                 return false;
1682
1683         return !!(dev->pme_support & (1 << state));
1684 }
1685 EXPORT_SYMBOL(pci_pme_capable);
1686
1687 static void pci_pme_list_scan(struct work_struct *work)
1688 {
1689         struct pci_pme_device *pme_dev, *n;
1690
1691         mutex_lock(&pci_pme_list_mutex);
1692         list_for_each_entry_safe(pme_dev, n, &pci_pme_list, list) {
1693                 if (pme_dev->dev->pme_poll) {
1694                         struct pci_dev *bridge;
1695
1696                         bridge = pme_dev->dev->bus->self;
1697                         /*
1698                          * If bridge is in low power state, the
1699                          * configuration space of subordinate devices
1700                          * may be not accessible
1701                          */
1702                         if (bridge && bridge->current_state != PCI_D0)
1703                                 continue;
1704                         pci_pme_wakeup(pme_dev->dev, NULL);
1705                 } else {
1706                         list_del(&pme_dev->list);
1707                         kfree(pme_dev);
1708                 }
1709         }
1710         if (!list_empty(&pci_pme_list))
1711                 schedule_delayed_work(&pci_pme_work,
1712                                       msecs_to_jiffies(PME_TIMEOUT));
1713         mutex_unlock(&pci_pme_list_mutex);
1714 }
1715
1716 /**
1717  * pci_pme_active - enable or disable PCI device's PME# function
1718  * @dev: PCI device to handle.
1719  * @enable: 'true' to enable PME# generation; 'false' to disable it.
1720  *
1721  * The caller must verify that the device is capable of generating PME# before
1722  * calling this function with @enable equal to 'true'.
1723  */
1724 void pci_pme_active(struct pci_dev *dev, bool enable)
1725 {
1726         u16 pmcsr;
1727
1728         if (!dev->pme_support)
1729                 return;
1730
1731         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
1732         /* Clear PME_Status by writing 1 to it and enable PME# */
1733         pmcsr |= PCI_PM_CTRL_PME_STATUS | PCI_PM_CTRL_PME_ENABLE;
1734         if (!enable)
1735                 pmcsr &= ~PCI_PM_CTRL_PME_ENABLE;
1736
1737         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, pmcsr);
1738
1739         /*
1740          * PCI (as opposed to PCIe) PME requires that the device have
1741          * its PME# line hooked up correctly. Not all hardware vendors
1742          * do this, so the PME never gets delivered and the device
1743          * remains asleep. The easiest way around this is to
1744          * periodically walk the list of suspended devices and check
1745          * whether any have their PME flag set. The assumption is that
1746          * we'll wake up often enough anyway that this won't be a huge
1747          * hit, and the power savings from the devices will still be a
1748          * win.
1749          *
1750          * Although PCIe uses in-band PME message instead of PME# line
1751          * to report PME, PME does not work for some PCIe devices in
1752          * reality.  For example, there are devices that set their PME
1753          * status bits, but don't really bother to send a PME message;
1754          * there are PCI Express Root Ports that don't bother to
1755          * trigger interrupts when they receive PME messages from the
1756          * devices below.  So PME poll is used for PCIe devices too.
1757          */
1758
1759         if (dev->pme_poll) {
1760                 struct pci_pme_device *pme_dev;
1761                 if (enable) {
1762                         pme_dev = kmalloc(sizeof(struct pci_pme_device),
1763                                           GFP_KERNEL);
1764                         if (!pme_dev) {
1765                                 dev_warn(&dev->dev, "can't enable PME#\n");
1766                                 return;
1767                         }
1768                         pme_dev->dev = dev;
1769                         mutex_lock(&pci_pme_list_mutex);
1770                         list_add(&pme_dev->list, &pci_pme_list);
1771                         if (list_is_singular(&pci_pme_list))
1772                                 schedule_delayed_work(&pci_pme_work,
1773                                                       msecs_to_jiffies(PME_TIMEOUT));
1774                         mutex_unlock(&pci_pme_list_mutex);
1775                 } else {
1776                         mutex_lock(&pci_pme_list_mutex);
1777                         list_for_each_entry(pme_dev, &pci_pme_list, list) {
1778                                 if (pme_dev->dev == dev) {
1779                                         list_del(&pme_dev->list);
1780                                         kfree(pme_dev);
1781                                         break;
1782                                 }
1783                         }
1784                         mutex_unlock(&pci_pme_list_mutex);
1785                 }
1786         }
1787
1788         dev_dbg(&dev->dev, "PME# %s\n", enable ? "enabled" : "disabled");
1789 }
1790 EXPORT_SYMBOL(pci_pme_active);
1791
1792 /**
1793  * __pci_enable_wake - enable PCI device as wakeup event source
1794  * @dev: PCI device affected
1795  * @state: PCI state from which device will issue wakeup events
1796  * @runtime: True if the events are to be generated at run time
1797  * @enable: True to enable event generation; false to disable
1798  *
1799  * This enables the device as a wakeup event source, or disables it.
1800  * When such events involves platform-specific hooks, those hooks are
1801  * called automatically by this routine.
1802  *
1803  * Devices with legacy power management (no standard PCI PM capabilities)
1804  * always require such platform hooks.
1805  *
1806  * RETURN VALUE:
1807  * 0 is returned on success
1808  * -EINVAL is returned if device is not supposed to wake up the system
1809  * Error code depending on the platform is returned if both the platform and
1810  * the native mechanism fail to enable the generation of wake-up events
1811  */
1812 int __pci_enable_wake(struct pci_dev *dev, pci_power_t state,
1813                       bool runtime, bool enable)
1814 {
1815         int ret = 0;
1816
1817         if (enable && !runtime && !device_may_wakeup(&dev->dev))
1818                 return -EINVAL;
1819
1820         /* Don't do the same thing twice in a row for one device. */
1821         if (!!enable == !!dev->wakeup_prepared)
1822                 return 0;
1823
1824         /*
1825          * According to "PCI System Architecture" 4th ed. by Tom Shanley & Don
1826          * Anderson we should be doing PME# wake enable followed by ACPI wake
1827          * enable.  To disable wake-up we call the platform first, for symmetry.
1828          */
1829
1830         if (enable) {
1831                 int error;
1832
1833                 if (pci_pme_capable(dev, state))
1834                         pci_pme_active(dev, true);
1835                 else
1836                         ret = 1;
1837                 error = runtime ? platform_pci_run_wake(dev, true) :
1838                                         platform_pci_sleep_wake(dev, true);
1839                 if (ret)
1840                         ret = error;
1841                 if (!ret)
1842                         dev->wakeup_prepared = true;
1843         } else {
1844                 if (runtime)
1845                         platform_pci_run_wake(dev, false);
1846                 else
1847                         platform_pci_sleep_wake(dev, false);
1848                 pci_pme_active(dev, false);
1849                 dev->wakeup_prepared = false;
1850         }
1851
1852         return ret;
1853 }
1854 EXPORT_SYMBOL(__pci_enable_wake);
1855
1856 /**
1857  * pci_wake_from_d3 - enable/disable device to wake up from D3_hot or D3_cold
1858  * @dev: PCI device to prepare
1859  * @enable: True to enable wake-up event generation; false to disable
1860  *
1861  * Many drivers want the device to wake up the system from D3_hot or D3_cold
1862  * and this function allows them to set that up cleanly - pci_enable_wake()
1863  * should not be called twice in a row to enable wake-up due to PCI PM vs ACPI
1864  * ordering constraints.
1865  *
1866  * This function only returns error code if the device is not capable of
1867  * generating PME# from both D3_hot and D3_cold, and the platform is unable to
1868  * enable wake-up power for it.
1869  */
1870 int pci_wake_from_d3(struct pci_dev *dev, bool enable)
1871 {
1872         return pci_pme_capable(dev, PCI_D3cold) ?
1873                         pci_enable_wake(dev, PCI_D3cold, enable) :
1874                         pci_enable_wake(dev, PCI_D3hot, enable);
1875 }
1876 EXPORT_SYMBOL(pci_wake_from_d3);
1877
1878 /**
1879  * pci_target_state - find an appropriate low power state for a given PCI dev
1880  * @dev: PCI device
1881  *
1882  * Use underlying platform code to find a supported low power state for @dev.
1883  * If the platform can't manage @dev, return the deepest state from which it
1884  * can generate wake events, based on any available PME info.
1885  */
1886 static pci_power_t pci_target_state(struct pci_dev *dev)
1887 {
1888         pci_power_t target_state = PCI_D3hot;
1889
1890         if (platform_pci_power_manageable(dev)) {
1891                 /*
1892                  * Call the platform to choose the target state of the device
1893                  * and enable wake-up from this state if supported.
1894                  */
1895                 pci_power_t state = platform_pci_choose_state(dev);
1896
1897                 switch (state) {
1898                 case PCI_POWER_ERROR:
1899                 case PCI_UNKNOWN:
1900                         break;
1901                 case PCI_D1:
1902                 case PCI_D2:
1903                         if (pci_no_d1d2(dev))
1904                                 break;
1905                 default:
1906                         target_state = state;
1907                 }
1908         } else if (!dev->pm_cap) {
1909                 target_state = PCI_D0;
1910         } else if (device_may_wakeup(&dev->dev)) {
1911                 /*
1912                  * Find the deepest state from which the device can generate
1913                  * wake-up events, make it the target state and enable device
1914                  * to generate PME#.
1915                  */
1916                 if (dev->pme_support) {
1917                         while (target_state
1918                               && !(dev->pme_support & (1 << target_state)))
1919                                 target_state--;
1920                 }
1921         }
1922
1923         return target_state;
1924 }
1925
1926 /**
1927  * pci_prepare_to_sleep - prepare PCI device for system-wide transition into a sleep state
1928  * @dev: Device to handle.
1929  *
1930  * Choose the power state appropriate for the device depending on whether
1931  * it can wake up the system and/or is power manageable by the platform
1932  * (PCI_D3hot is the default) and put the device into that state.
1933  */
1934 int pci_prepare_to_sleep(struct pci_dev *dev)
1935 {
1936         pci_power_t target_state = pci_target_state(dev);
1937         int error;
1938
1939         if (target_state == PCI_POWER_ERROR)
1940                 return -EIO;
1941
1942         pci_enable_wake(dev, target_state, device_may_wakeup(&dev->dev));
1943
1944         error = pci_set_power_state(dev, target_state);
1945
1946         if (error)
1947                 pci_enable_wake(dev, target_state, false);
1948
1949         return error;
1950 }
1951 EXPORT_SYMBOL(pci_prepare_to_sleep);
1952
1953 /**
1954  * pci_back_from_sleep - turn PCI device on during system-wide transition into working state
1955  * @dev: Device to handle.
1956  *
1957  * Disable device's system wake-up capability and put it into D0.
1958  */
1959 int pci_back_from_sleep(struct pci_dev *dev)
1960 {
1961         pci_enable_wake(dev, PCI_D0, false);
1962         return pci_set_power_state(dev, PCI_D0);
1963 }
1964 EXPORT_SYMBOL(pci_back_from_sleep);
1965
1966 /**
1967  * pci_finish_runtime_suspend - Carry out PCI-specific part of runtime suspend.
1968  * @dev: PCI device being suspended.
1969  *
1970  * Prepare @dev to generate wake-up events at run time and put it into a low
1971  * power state.
1972  */
1973 int pci_finish_runtime_suspend(struct pci_dev *dev)
1974 {
1975         pci_power_t target_state = pci_target_state(dev);
1976         int error;
1977
1978         if (target_state == PCI_POWER_ERROR)
1979                 return -EIO;
1980
1981         dev->runtime_d3cold = target_state == PCI_D3cold;
1982
1983         __pci_enable_wake(dev, target_state, true, pci_dev_run_wake(dev));
1984
1985         error = pci_set_power_state(dev, target_state);
1986
1987         if (error) {
1988                 __pci_enable_wake(dev, target_state, true, false);
1989                 dev->runtime_d3cold = false;
1990         }
1991
1992         return error;
1993 }
1994
1995 /**
1996  * pci_dev_run_wake - Check if device can generate run-time wake-up events.
1997  * @dev: Device to check.
1998  *
1999  * Return true if the device itself is capable of generating wake-up events
2000  * (through the platform or using the native PCIe PME) or if the device supports
2001  * PME and one of its upstream bridges can generate wake-up events.
2002  */
2003 bool pci_dev_run_wake(struct pci_dev *dev)
2004 {
2005         struct pci_bus *bus = dev->bus;
2006
2007         if (device_run_wake(&dev->dev))
2008                 return true;
2009
2010         if (!dev->pme_support)
2011                 return false;
2012
2013         while (bus->parent) {
2014                 struct pci_dev *bridge = bus->self;
2015
2016                 if (device_run_wake(&bridge->dev))
2017                         return true;
2018
2019                 bus = bus->parent;
2020         }
2021
2022         /* We have reached the root bus. */
2023         if (bus->bridge)
2024                 return device_run_wake(bus->bridge);
2025
2026         return false;
2027 }
2028 EXPORT_SYMBOL_GPL(pci_dev_run_wake);
2029
2030 /**
2031  * pci_dev_keep_suspended - Check if the device can stay in the suspended state.
2032  * @pci_dev: Device to check.
2033  *
2034  * Return 'true' if the device is runtime-suspended, it doesn't have to be
2035  * reconfigured due to wakeup settings difference between system and runtime
2036  * suspend and the current power state of it is suitable for the upcoming
2037  * (system) transition.
2038  */
2039 bool pci_dev_keep_suspended(struct pci_dev *pci_dev)
2040 {
2041         struct device *dev = &pci_dev->dev;
2042
2043         if (!pm_runtime_suspended(dev)
2044             || (device_can_wakeup(dev) && !device_may_wakeup(dev))
2045             || platform_pci_need_resume(pci_dev))
2046                 return false;
2047
2048         return pci_target_state(pci_dev) == pci_dev->current_state;
2049 }
2050
2051 void pci_config_pm_runtime_get(struct pci_dev *pdev)
2052 {
2053         struct device *dev = &pdev->dev;
2054         struct device *parent = dev->parent;
2055
2056         if (parent)
2057                 pm_runtime_get_sync(parent);
2058         pm_runtime_get_noresume(dev);
2059         /*
2060          * pdev->current_state is set to PCI_D3cold during suspending,
2061          * so wait until suspending completes
2062          */
2063         pm_runtime_barrier(dev);
2064         /*
2065          * Only need to resume devices in D3cold, because config
2066          * registers are still accessible for devices suspended but
2067          * not in D3cold.
2068          */
2069         if (pdev->current_state == PCI_D3cold)
2070                 pm_runtime_resume(dev);
2071 }
2072
2073 void pci_config_pm_runtime_put(struct pci_dev *pdev)
2074 {
2075         struct device *dev = &pdev->dev;
2076         struct device *parent = dev->parent;
2077
2078         pm_runtime_put(dev);
2079         if (parent)
2080                 pm_runtime_put_sync(parent);
2081 }
2082
2083 /**
2084  * pci_pm_init - Initialize PM functions of given PCI device
2085  * @dev: PCI device to handle.
2086  */
2087 void pci_pm_init(struct pci_dev *dev)
2088 {
2089         int pm;
2090         u16 pmc;
2091
2092         pm_runtime_forbid(&dev->dev);
2093         pm_runtime_set_active(&dev->dev);
2094         pm_runtime_enable(&dev->dev);
2095         device_enable_async_suspend(&dev->dev);
2096         dev->wakeup_prepared = false;
2097
2098         dev->pm_cap = 0;
2099         dev->pme_support = 0;
2100
2101         /* find PCI PM capability in list */
2102         pm = pci_find_capability(dev, PCI_CAP_ID_PM);
2103         if (!pm)
2104                 return;
2105         /* Check device's ability to generate PME# */
2106         pci_read_config_word(dev, pm + PCI_PM_PMC, &pmc);
2107
2108         if ((pmc & PCI_PM_CAP_VER_MASK) > 3) {
2109                 dev_err(&dev->dev, "unsupported PM cap regs version (%u)\n",
2110                         pmc & PCI_PM_CAP_VER_MASK);
2111                 return;
2112         }
2113
2114         dev->pm_cap = pm;
2115         dev->d3_delay = PCI_PM_D3_WAIT;
2116         dev->d3cold_delay = PCI_PM_D3COLD_WAIT;
2117         dev->d3cold_allowed = true;
2118
2119         dev->d1_support = false;
2120         dev->d2_support = false;
2121         if (!pci_no_d1d2(dev)) {
2122                 if (pmc & PCI_PM_CAP_D1)
2123                         dev->d1_support = true;
2124                 if (pmc & PCI_PM_CAP_D2)
2125                         dev->d2_support = true;
2126
2127                 if (dev->d1_support || dev->d2_support)
2128                         dev_printk(KERN_DEBUG, &dev->dev, "supports%s%s\n",
2129                                    dev->d1_support ? " D1" : "",
2130                                    dev->d2_support ? " D2" : "");
2131         }
2132
2133         pmc &= PCI_PM_CAP_PME_MASK;
2134         if (pmc) {
2135                 dev_printk(KERN_DEBUG, &dev->dev,
2136                          "PME# supported from%s%s%s%s%s\n",
2137                          (pmc & PCI_PM_CAP_PME_D0) ? " D0" : "",
2138                          (pmc & PCI_PM_CAP_PME_D1) ? " D1" : "",
2139                          (pmc & PCI_PM_CAP_PME_D2) ? " D2" : "",
2140                          (pmc & PCI_PM_CAP_PME_D3) ? " D3hot" : "",
2141                          (pmc & PCI_PM_CAP_PME_D3cold) ? " D3cold" : "");
2142                 dev->pme_support = pmc >> PCI_PM_CAP_PME_SHIFT;
2143                 dev->pme_poll = true;
2144                 /*
2145                  * Make device's PM flags reflect the wake-up capability, but
2146                  * let the user space enable it to wake up the system as needed.
2147                  */
2148                 device_set_wakeup_capable(&dev->dev, true);
2149                 /* Disable the PME# generation functionality */
2150                 pci_pme_active(dev, false);
2151         }
2152 }
2153
2154 static void pci_add_saved_cap(struct pci_dev *pci_dev,
2155         struct pci_cap_saved_state *new_cap)
2156 {
2157         hlist_add_head(&new_cap->next, &pci_dev->saved_cap_space);
2158 }
2159
2160 /**
2161  * _pci_add_cap_save_buffer - allocate buffer for saving given
2162  *                            capability registers
2163  * @dev: the PCI device
2164  * @cap: the capability to allocate the buffer for
2165  * @extended: Standard or Extended capability ID
2166  * @size: requested size of the buffer
2167  */
2168 static int _pci_add_cap_save_buffer(struct pci_dev *dev, u16 cap,
2169                                     bool extended, unsigned int size)
2170 {
2171         int pos;
2172         struct pci_cap_saved_state *save_state;
2173
2174         if (extended)
2175                 pos = pci_find_ext_capability(dev, cap);
2176         else
2177                 pos = pci_find_capability(dev, cap);
2178
2179         if (!pos)
2180                 return 0;
2181
2182         save_state = kzalloc(sizeof(*save_state) + size, GFP_KERNEL);
2183         if (!save_state)
2184                 return -ENOMEM;
2185
2186         save_state->cap.cap_nr = cap;
2187         save_state->cap.cap_extended = extended;
2188         save_state->cap.size = size;
2189         pci_add_saved_cap(dev, save_state);
2190
2191         return 0;
2192 }
2193
2194 int pci_add_cap_save_buffer(struct pci_dev *dev, char cap, unsigned int size)
2195 {
2196         return _pci_add_cap_save_buffer(dev, cap, false, size);
2197 }
2198
2199 int pci_add_ext_cap_save_buffer(struct pci_dev *dev, u16 cap, unsigned int size)
2200 {
2201         return _pci_add_cap_save_buffer(dev, cap, true, size);
2202 }
2203
2204 /**
2205  * pci_allocate_cap_save_buffers - allocate buffers for saving capabilities
2206  * @dev: the PCI device
2207  */
2208 void pci_allocate_cap_save_buffers(struct pci_dev *dev)
2209 {
2210         int error;
2211
2212         error = pci_add_cap_save_buffer(dev, PCI_CAP_ID_EXP,
2213                                         PCI_EXP_SAVE_REGS * sizeof(u16));
2214         if (error)
2215                 dev_err(&dev->dev,
2216                         "unable to preallocate PCI Express save buffer\n");
2217
2218         error = pci_add_cap_save_buffer(dev, PCI_CAP_ID_PCIX, sizeof(u16));
2219         if (error)
2220                 dev_err(&dev->dev,
2221                         "unable to preallocate PCI-X save buffer\n");
2222
2223         pci_allocate_vc_save_buffers(dev);
2224 }
2225
2226 void pci_free_cap_save_buffers(struct pci_dev *dev)
2227 {
2228         struct pci_cap_saved_state *tmp;
2229         struct hlist_node *n;
2230
2231         hlist_for_each_entry_safe(tmp, n, &dev->saved_cap_space, next)
2232                 kfree(tmp);
2233 }
2234
2235 /**
2236  * pci_configure_ari - enable or disable ARI forwarding
2237  * @dev: the PCI device
2238  *
2239  * If @dev and its upstream bridge both support ARI, enable ARI in the
2240  * bridge.  Otherwise, disable ARI in the bridge.
2241  */
2242 void pci_configure_ari(struct pci_dev *dev)
2243 {
2244         u32 cap;
2245         struct pci_dev *bridge;
2246
2247         if (pcie_ari_disabled || !pci_is_pcie(dev) || dev->devfn)
2248                 return;
2249
2250         bridge = dev->bus->self;
2251         if (!bridge)
2252                 return;
2253
2254         pcie_capability_read_dword(bridge, PCI_EXP_DEVCAP2, &cap);
2255         if (!(cap & PCI_EXP_DEVCAP2_ARI))
2256                 return;
2257
2258         if (pci_find_ext_capability(dev, PCI_EXT_CAP_ID_ARI)) {
2259                 pcie_capability_set_word(bridge, PCI_EXP_DEVCTL2,
2260                                          PCI_EXP_DEVCTL2_ARI);
2261                 bridge->ari_enabled = 1;
2262         } else {
2263                 pcie_capability_clear_word(bridge, PCI_EXP_DEVCTL2,
2264                                            PCI_EXP_DEVCTL2_ARI);
2265                 bridge->ari_enabled = 0;
2266         }
2267 }
2268
2269 static int pci_acs_enable;
2270
2271 /**
2272  * pci_request_acs - ask for ACS to be enabled if supported
2273  */
2274 void pci_request_acs(void)
2275 {
2276         pci_acs_enable = 1;
2277 }
2278
2279 /**
2280  * pci_std_enable_acs - enable ACS on devices using standard ACS capabilites
2281  * @dev: the PCI device
2282  */
2283 static int pci_std_enable_acs(struct pci_dev *dev)
2284 {
2285         int pos;
2286         u16 cap;
2287         u16 ctrl;
2288
2289         pos = pci_find_ext_capability(dev, PCI_EXT_CAP_ID_ACS);
2290         if (!pos)
2291                 return -ENODEV;
2292
2293         pci_read_config_word(dev, pos + PCI_ACS_CAP, &cap);
2294         pci_read_config_word(dev, pos + PCI_ACS_CTRL, &ctrl);
2295
2296         /* Source Validation */
2297         ctrl |= (cap & PCI_ACS_SV);
2298
2299         /* P2P Request Redirect */
2300         ctrl |= (cap & PCI_ACS_RR);
2301
2302         /* P2P Completion Redirect */
2303         ctrl |= (cap & PCI_ACS_CR);
2304
2305         /* Upstream Forwarding */
2306         ctrl |= (cap & PCI_ACS_UF);
2307
2308         pci_write_config_word(dev, pos + PCI_ACS_CTRL, ctrl);
2309
2310         return 0;
2311 }
2312
2313 /**
2314  * pci_enable_acs - enable ACS if hardware support it
2315  * @dev: the PCI device
2316  */
2317 void pci_enable_acs(struct pci_dev *dev)
2318 {
2319         if (!pci_acs_enable)
2320                 return;
2321
2322         if (!pci_std_enable_acs(dev))
2323                 return;
2324
2325         pci_dev_specific_enable_acs(dev);
2326 }
2327
2328 static bool pci_acs_flags_enabled(struct pci_dev *pdev, u16 acs_flags)
2329 {
2330         int pos;
2331         u16 cap, ctrl;
2332
2333         pos = pci_find_ext_capability(pdev, PCI_EXT_CAP_ID_ACS);
2334         if (!pos)
2335                 return false;
2336
2337         /*
2338          * Except for egress control, capabilities are either required
2339          * or only required if controllable.  Features missing from the
2340          * capability field can therefore be assumed as hard-wired enabled.
2341          */
2342         pci_read_config_word(pdev, pos + PCI_ACS_CAP, &cap);
2343         acs_flags &= (cap | PCI_ACS_EC);
2344
2345         pci_read_config_word(pdev, pos + PCI_ACS_CTRL, &ctrl);
2346         return (ctrl & acs_flags) == acs_flags;
2347 }
2348
2349 /**
2350  * pci_acs_enabled - test ACS against required flags for a given device
2351  * @pdev: device to test
2352  * @acs_flags: required PCI ACS flags
2353  *
2354  * Return true if the device supports the provided flags.  Automatically
2355  * filters out flags that are not implemented on multifunction devices.
2356  *
2357  * Note that this interface checks the effective ACS capabilities of the
2358  * device rather than the actual capabilities.  For instance, most single
2359  * function endpoints are not required to support ACS because they have no
2360  * opportunity for peer-to-peer access.  We therefore return 'true'
2361  * regardless of whether the device exposes an ACS capability.  This makes
2362  * it much easier for callers of this function to ignore the actual type
2363  * or topology of the device when testing ACS support.
2364  */
2365 bool pci_acs_enabled(struct pci_dev *pdev, u16 acs_flags)
2366 {
2367         int ret;
2368
2369         ret = pci_dev_specific_acs_enabled(pdev, acs_flags);
2370         if (ret >= 0)
2371                 return ret > 0;
2372
2373         /*
2374          * Conventional PCI and PCI-X devices never support ACS, either
2375          * effectively or actually.  The shared bus topology implies that
2376          * any device on the bus can receive or snoop DMA.
2377          */
2378         if (!pci_is_pcie(pdev))
2379                 return false;
2380
2381         switch (pci_pcie_type(pdev)) {
2382         /*
2383          * PCI/X-to-PCIe bridges are not specifically mentioned by the spec,
2384          * but since their primary interface is PCI/X, we conservatively
2385          * handle them as we would a non-PCIe device.
2386          */
2387         case PCI_EXP_TYPE_PCIE_BRIDGE:
2388         /*
2389          * PCIe 3.0, 6.12.1 excludes ACS on these devices.  "ACS is never
2390          * applicable... must never implement an ACS Extended Capability...".
2391          * This seems arbitrary, but we take a conservative interpretation
2392          * of this statement.
2393          */
2394         case PCI_EXP_TYPE_PCI_BRIDGE:
2395         case PCI_EXP_TYPE_RC_EC:
2396                 return false;
2397         /*
2398          * PCIe 3.0, 6.12.1.1 specifies that downstream and root ports should
2399          * implement ACS in order to indicate their peer-to-peer capabilities,
2400          * regardless of whether they are single- or multi-function devices.
2401          */
2402         case PCI_EXP_TYPE_DOWNSTREAM:
2403         case PCI_EXP_TYPE_ROOT_PORT:
2404                 return pci_acs_flags_enabled(pdev, acs_flags);
2405         /*
2406          * PCIe 3.0, 6.12.1.2 specifies ACS capabilities that should be
2407          * implemented by the remaining PCIe types to indicate peer-to-peer
2408          * capabilities, but only when they are part of a multifunction
2409          * device.  The footnote for section 6.12 indicates the specific
2410          * PCIe types included here.
2411          */
2412         case PCI_EXP_TYPE_ENDPOINT:
2413         case PCI_EXP_TYPE_UPSTREAM:
2414         case PCI_EXP_TYPE_LEG_END:
2415         case PCI_EXP_TYPE_RC_END:
2416                 if (!pdev->multifunction)
2417                         break;
2418
2419                 return pci_acs_flags_enabled(pdev, acs_flags);
2420         }
2421
2422         /*
2423          * PCIe 3.0, 6.12.1.3 specifies no ACS capabilities are applicable
2424          * to single function devices with the exception of downstream ports.
2425          */
2426         return true;
2427 }
2428
2429 /**
2430  * pci_acs_path_enable - test ACS flags from start to end in a hierarchy
2431  * @start: starting downstream device
2432  * @end: ending upstream device or NULL to search to the root bus
2433  * @acs_flags: required flags
2434  *
2435  * Walk up a device tree from start to end testing PCI ACS support.  If
2436  * any step along the way does not support the required flags, return false.
2437  */
2438 bool pci_acs_path_enabled(struct pci_dev *start,
2439                           struct pci_dev *end, u16 acs_flags)
2440 {
2441         struct pci_dev *pdev, *parent = start;
2442
2443         do {
2444                 pdev = parent;
2445
2446                 if (!pci_acs_enabled(pdev, acs_flags))
2447                         return false;
2448
2449                 if (pci_is_root_bus(pdev->bus))
2450                         return (end == NULL);
2451
2452                 parent = pdev->bus->self;
2453         } while (pdev != end);
2454
2455         return true;
2456 }
2457
2458 /**
2459  * pci_swizzle_interrupt_pin - swizzle INTx for device behind bridge
2460  * @dev: the PCI device
2461  * @pin: the INTx pin (1=INTA, 2=INTB, 3=INTC, 4=INTD)
2462  *
2463  * Perform INTx swizzling for a device behind one level of bridge.  This is
2464  * required by section 9.1 of the PCI-to-PCI bridge specification for devices
2465  * behind bridges on add-in cards.  For devices with ARI enabled, the slot
2466  * number is always 0 (see the Implementation Note in section 2.2.8.1 of
2467  * the PCI Express Base Specification, Revision 2.1)
2468  */
2469 u8 pci_swizzle_interrupt_pin(const struct pci_dev *dev, u8 pin)
2470 {
2471         int slot;
2472
2473         if (pci_ari_enabled(dev->bus))
2474                 slot = 0;
2475         else
2476                 slot = PCI_SLOT(dev->devfn);
2477
2478         return (((pin - 1) + slot) % 4) + 1;
2479 }
2480
2481 int pci_get_interrupt_pin(struct pci_dev *dev, struct pci_dev **bridge)
2482 {
2483         u8 pin;
2484
2485         pin = dev->pin;
2486         if (!pin)
2487                 return -1;
2488
2489         while (!pci_is_root_bus(dev->bus)) {
2490                 pin = pci_swizzle_interrupt_pin(dev, pin);
2491                 dev = dev->bus->self;
2492         }
2493         *bridge = dev;
2494         return pin;
2495 }
2496
2497 /**
2498  * pci_common_swizzle - swizzle INTx all the way to root bridge
2499  * @dev: the PCI device
2500  * @pinp: pointer to the INTx pin value (1=INTA, 2=INTB, 3=INTD, 4=INTD)
2501  *
2502  * Perform INTx swizzling for a device.  This traverses through all PCI-to-PCI
2503  * bridges all the way up to a PCI root bus.
2504  */
2505 u8 pci_common_swizzle(struct pci_dev *dev, u8 *pinp)
2506 {
2507         u8 pin = *pinp;
2508
2509         while (!pci_is_root_bus(dev->bus)) {
2510                 pin = pci_swizzle_interrupt_pin(dev, pin);
2511                 dev = dev->bus->self;
2512         }
2513         *pinp = pin;
2514         return PCI_SLOT(dev->devfn);
2515 }
2516 EXPORT_SYMBOL_GPL(pci_common_swizzle);
2517
2518 /**
2519  *      pci_release_region - Release a PCI bar
2520  *      @pdev: PCI device whose resources were previously reserved by pci_request_region
2521  *      @bar: BAR to release
2522  *
2523  *      Releases the PCI I/O and memory resources previously reserved by a
2524  *      successful call to pci_request_region.  Call this function only
2525  *      after all use of the PCI regions has ceased.
2526  */
2527 void pci_release_region(struct pci_dev *pdev, int bar)
2528 {
2529         struct pci_devres *dr;
2530
2531         if (pci_resource_len(pdev, bar) == 0)
2532                 return;
2533         if (pci_resource_flags(pdev, bar) & IORESOURCE_IO)
2534                 release_region(pci_resource_start(pdev, bar),
2535                                 pci_resource_len(pdev, bar));
2536         else if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM)
2537                 release_mem_region(pci_resource_start(pdev, bar),
2538                                 pci_resource_len(pdev, bar));
2539
2540         dr = find_pci_dr(pdev);
2541         if (dr)
2542                 dr->region_mask &= ~(1 << bar);
2543 }
2544 EXPORT_SYMBOL(pci_release_region);
2545
2546 /**
2547  *      __pci_request_region - Reserved PCI I/O and memory resource
2548  *      @pdev: PCI device whose resources are to be reserved
2549  *      @bar: BAR to be reserved
2550  *      @res_name: Name to be associated with resource.
2551  *      @exclusive: whether the region access is exclusive or not
2552  *
2553  *      Mark the PCI region associated with PCI device @pdev BR @bar as
2554  *      being reserved by owner @res_name.  Do not access any
2555  *      address inside the PCI regions unless this call returns
2556  *      successfully.
2557  *
2558  *      If @exclusive is set, then the region is marked so that userspace
2559  *      is explicitly not allowed to map the resource via /dev/mem or
2560  *      sysfs MMIO access.
2561  *
2562  *      Returns 0 on success, or %EBUSY on error.  A warning
2563  *      message is also printed on failure.
2564  */
2565 static int __pci_request_region(struct pci_dev *pdev, int bar,
2566                                 const char *res_name, int exclusive)
2567 {
2568         struct pci_devres *dr;
2569
2570         if (pci_resource_len(pdev, bar) == 0)
2571                 return 0;
2572
2573         if (pci_resource_flags(pdev, bar) & IORESOURCE_IO) {
2574                 if (!request_region(pci_resource_start(pdev, bar),
2575                             pci_resource_len(pdev, bar), res_name))
2576                         goto err_out;
2577         } else if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM) {
2578                 if (!__request_mem_region(pci_resource_start(pdev, bar),
2579                                         pci_resource_len(pdev, bar), res_name,
2580                                         exclusive))
2581                         goto err_out;
2582         }
2583
2584         dr = find_pci_dr(pdev);
2585         if (dr)
2586                 dr->region_mask |= 1 << bar;
2587
2588         return 0;
2589
2590 err_out:
2591         dev_warn(&pdev->dev, "BAR %d: can't reserve %pR\n", bar,
2592                  &pdev->resource[bar]);
2593         return -EBUSY;
2594 }
2595
2596 /**
2597  *      pci_request_region - Reserve PCI I/O and memory resource
2598  *      @pdev: PCI device whose resources are to be reserved
2599  *      @bar: BAR to be reserved
2600  *      @res_name: Name to be associated with resource
2601  *
2602  *      Mark the PCI region associated with PCI device @pdev BAR @bar as
2603  *      being reserved by owner @res_name.  Do not access any
2604  *      address inside the PCI regions unless this call returns
2605  *      successfully.
2606  *
2607  *      Returns 0 on success, or %EBUSY on error.  A warning
2608  *      message is also printed on failure.
2609  */
2610 int pci_request_region(struct pci_dev *pdev, int bar, const char *res_name)
2611 {
2612         return __pci_request_region(pdev, bar, res_name, 0);
2613 }
2614 EXPORT_SYMBOL(pci_request_region);
2615
2616 /**
2617  *      pci_request_region_exclusive - Reserved PCI I/O and memory resource
2618  *      @pdev: PCI device whose resources are to be reserved
2619  *      @bar: BAR to be reserved
2620  *      @res_name: Name to be associated with resource.
2621  *
2622  *      Mark the PCI region associated with PCI device @pdev BR @bar as
2623  *      being reserved by owner @res_name.  Do not access any
2624  *      address inside the PCI regions unless this call returns
2625  *      successfully.
2626  *
2627  *      Returns 0 on success, or %EBUSY on error.  A warning
2628  *      message is also printed on failure.
2629  *
2630  *      The key difference that _exclusive makes it that userspace is
2631  *      explicitly not allowed to map the resource via /dev/mem or
2632  *      sysfs.
2633  */
2634 int pci_request_region_exclusive(struct pci_dev *pdev, int bar,
2635                                  const char *res_name)
2636 {
2637         return __pci_request_region(pdev, bar, res_name, IORESOURCE_EXCLUSIVE);
2638 }
2639 EXPORT_SYMBOL(pci_request_region_exclusive);
2640
2641 /**
2642  * pci_release_selected_regions - Release selected PCI I/O and memory resources
2643  * @pdev: PCI device whose resources were previously reserved
2644  * @bars: Bitmask of BARs to be released
2645  *
2646  * Release selected PCI I/O and memory resources previously reserved.
2647  * Call this function only after all use of the PCI regions has ceased.
2648  */
2649 void pci_release_selected_regions(struct pci_dev *pdev, int bars)
2650 {
2651         int i;
2652
2653         for (i = 0; i < 6; i++)
2654                 if (bars & (1 << i))
2655                         pci_release_region(pdev, i);
2656 }
2657 EXPORT_SYMBOL(pci_release_selected_regions);
2658
2659 static int __pci_request_selected_regions(struct pci_dev *pdev, int bars,
2660                                           const char *res_name, int excl)
2661 {
2662         int i;
2663
2664         for (i = 0; i < 6; i++)
2665                 if (bars & (1 << i))
2666                         if (__pci_request_region(pdev, i, res_name, excl))
2667                                 goto err_out;
2668         return 0;
2669
2670 err_out:
2671         while (--i >= 0)
2672                 if (bars & (1 << i))
2673                         pci_release_region(pdev, i);
2674
2675         return -EBUSY;
2676 }
2677
2678
2679 /**
2680  * pci_request_selected_regions - Reserve selected PCI I/O and memory resources
2681  * @pdev: PCI device whose resources are to be reserved
2682  * @bars: Bitmask of BARs to be requested
2683  * @res_name: Name to be associated with resource
2684  */
2685 int pci_request_selected_regions(struct pci_dev *pdev, int bars,
2686                                  const char *res_name)
2687 {
2688         return __pci_request_selected_regions(pdev, bars, res_name, 0);
2689 }
2690 EXPORT_SYMBOL(pci_request_selected_regions);
2691
2692 int pci_request_selected_regions_exclusive(struct pci_dev *pdev, int bars,
2693                                            const char *res_name)
2694 {
2695         return __pci_request_selected_regions(pdev, bars, res_name,
2696                         IORESOURCE_EXCLUSIVE);
2697 }
2698 EXPORT_SYMBOL(pci_request_selected_regions_exclusive);
2699
2700 /**
2701  *      pci_release_regions - Release reserved PCI I/O and memory resources
2702  *      @pdev: PCI device whose resources were previously reserved by pci_request_regions
2703  *
2704  *      Releases all PCI I/O and memory resources previously reserved by a
2705  *      successful call to pci_request_regions.  Call this function only
2706  *      after all use of the PCI regions has ceased.
2707  */
2708
2709 void pci_release_regions(struct pci_dev *pdev)
2710 {
2711         pci_release_selected_regions(pdev, (1 << 6) - 1);
2712 }
2713 EXPORT_SYMBOL(pci_release_regions);
2714
2715 /**
2716  *      pci_request_regions - Reserved PCI I/O and memory resources
2717  *      @pdev: PCI device whose resources are to be reserved
2718  *      @res_name: Name to be associated with resource.
2719  *
2720  *      Mark all PCI regions associated with PCI device @pdev as
2721  *      being reserved by owner @res_name.  Do not access any
2722  *      address inside the PCI regions unless this call returns
2723  *      successfully.
2724  *
2725  *      Returns 0 on success, or %EBUSY on error.  A warning
2726  *      message is also printed on failure.
2727  */
2728 int pci_request_regions(struct pci_dev *pdev, const char *res_name)
2729 {
2730         return pci_request_selected_regions(pdev, ((1 << 6) - 1), res_name);
2731 }
2732 EXPORT_SYMBOL(pci_request_regions);
2733
2734 /**
2735  *      pci_request_regions_exclusive - Reserved PCI I/O and memory resources
2736  *      @pdev: PCI device whose resources are to be reserved
2737  *      @res_name: Name to be associated with resource.
2738  *
2739  *      Mark all PCI regions associated with PCI device @pdev as
2740  *      being reserved by owner @res_name.  Do not access any
2741  *      address inside the PCI regions unless this call returns
2742  *      successfully.
2743  *
2744  *      pci_request_regions_exclusive() will mark the region so that
2745  *      /dev/mem and the sysfs MMIO access will not be allowed.
2746  *
2747  *      Returns 0 on success, or %EBUSY on error.  A warning
2748  *      message is also printed on failure.
2749  */
2750 int pci_request_regions_exclusive(struct pci_dev *pdev, const char *res_name)
2751 {
2752         return pci_request_selected_regions_exclusive(pdev,
2753                                         ((1 << 6) - 1), res_name);
2754 }
2755 EXPORT_SYMBOL(pci_request_regions_exclusive);
2756
2757 /**
2758  *      pci_remap_iospace - Remap the memory mapped I/O space
2759  *      @res: Resource describing the I/O space
2760  *      @phys_addr: physical address of range to be mapped
2761  *
2762  *      Remap the memory mapped I/O space described by the @res
2763  *      and the CPU physical address @phys_addr into virtual address space.
2764  *      Only architectures that have memory mapped IO functions defined
2765  *      (and the PCI_IOBASE value defined) should call this function.
2766  */
2767 int __weak pci_remap_iospace(const struct resource *res, phys_addr_t phys_addr)
2768 {
2769 #if defined(PCI_IOBASE) && defined(CONFIG_MMU)
2770         unsigned long vaddr = (unsigned long)PCI_IOBASE + res->start;
2771
2772         if (!(res->flags & IORESOURCE_IO))
2773                 return -EINVAL;
2774
2775         if (res->end > IO_SPACE_LIMIT)
2776                 return -EINVAL;
2777
2778         return ioremap_page_range(vaddr, vaddr + resource_size(res), phys_addr,
2779                                   pgprot_device(PAGE_KERNEL));
2780 #else
2781         /* this architecture does not have memory mapped I/O space,
2782            so this function should never be called */
2783         WARN_ONCE(1, "This architecture does not support memory mapped I/O\n");
2784         return -ENODEV;
2785 #endif
2786 }
2787
2788 static void __pci_set_master(struct pci_dev *dev, bool enable)
2789 {
2790         u16 old_cmd, cmd;
2791
2792         pci_read_config_word(dev, PCI_COMMAND, &old_cmd);
2793         if (enable)
2794                 cmd = old_cmd | PCI_COMMAND_MASTER;
2795         else
2796                 cmd = old_cmd & ~PCI_COMMAND_MASTER;
2797         if (cmd != old_cmd) {
2798                 dev_dbg(&dev->dev, "%s bus mastering\n",
2799                         enable ? "enabling" : "disabling");
2800                 pci_write_config_word(dev, PCI_COMMAND, cmd);
2801         }
2802         dev->is_busmaster = enable;
2803 }
2804
2805 /**
2806  * pcibios_setup - process "pci=" kernel boot arguments
2807  * @str: string used to pass in "pci=" kernel boot arguments
2808  *
2809  * Process kernel boot arguments.  This is the default implementation.
2810  * Architecture specific implementations can override this as necessary.
2811  */
2812 char * __weak __init pcibios_setup(char *str)
2813 {
2814         return str;
2815 }
2816
2817 /**
2818  * pcibios_set_master - enable PCI bus-mastering for device dev
2819  * @dev: the PCI device to enable
2820  *
2821  * Enables PCI bus-mastering for the device.  This is the default
2822  * implementation.  Architecture specific implementations can override
2823  * this if necessary.
2824  */
2825 void __weak pcibios_set_master(struct pci_dev *dev)
2826 {
2827         u8 lat;
2828
2829         /* The latency timer doesn't apply to PCIe (either Type 0 or Type 1) */
2830         if (pci_is_pcie(dev))
2831                 return;
2832
2833         pci_read_config_byte(dev, PCI_LATENCY_TIMER, &lat);
2834         if (lat < 16)
2835                 lat = (64 <= pcibios_max_latency) ? 64 : pcibios_max_latency;
2836         else if (lat > pcibios_max_latency)
2837                 lat = pcibios_max_latency;
2838         else
2839                 return;
2840
2841         pci_write_config_byte(dev, PCI_LATENCY_TIMER, lat);
2842 }
2843
2844 /**
2845  * pci_set_master - enables bus-mastering for device dev
2846  * @dev: the PCI device to enable
2847  *
2848  * Enables bus-mastering on the device and calls pcibios_set_master()
2849  * to do the needed arch specific settings.
2850  */
2851 void pci_set_master(struct pci_dev *dev)
2852 {
2853         __pci_set_master(dev, true);
2854         pcibios_set_master(dev);
2855 }
2856 EXPORT_SYMBOL(pci_set_master);
2857
2858 /**
2859  * pci_clear_master - disables bus-mastering for device dev
2860  * @dev: the PCI device to disable
2861  */
2862 void pci_clear_master(struct pci_dev *dev)
2863 {
2864         __pci_set_master(dev, false);
2865 }
2866 EXPORT_SYMBOL(pci_clear_master);
2867
2868 /**
2869  * pci_set_cacheline_size - ensure the CACHE_LINE_SIZE register is programmed
2870  * @dev: the PCI device for which MWI is to be enabled
2871  *
2872  * Helper function for pci_set_mwi.
2873  * Originally copied from drivers/net/acenic.c.
2874  * Copyright 1998-2001 by Jes Sorensen, <jes@trained-monkey.org>.
2875  *
2876  * RETURNS: An appropriate -ERRNO error value on error, or zero for success.
2877  */
2878 int pci_set_cacheline_size(struct pci_dev *dev)
2879 {
2880         u8 cacheline_size;
2881
2882         if (!pci_cache_line_size)
2883                 return -EINVAL;
2884
2885         /* Validate current setting: the PCI_CACHE_LINE_SIZE must be
2886            equal to or multiple of the right value. */
2887         pci_read_config_byte(dev, PCI_CACHE_LINE_SIZE, &cacheline_size);
2888         if (cacheline_size >= pci_cache_line_size &&
2889             (cacheline_size % pci_cache_line_size) == 0)
2890                 return 0;
2891
2892         /* Write the correct value. */
2893         pci_write_config_byte(dev, PCI_CACHE_LINE_SIZE, pci_cache_line_size);
2894         /* Read it back. */
2895         pci_read_config_byte(dev, PCI_CACHE_LINE_SIZE, &cacheline_size);
2896         if (cacheline_size == pci_cache_line_size)
2897                 return 0;
2898
2899         dev_printk(KERN_DEBUG, &dev->dev, "cache line size of %d is not supported\n",
2900                    pci_cache_line_size << 2);
2901
2902         return -EINVAL;
2903 }
2904 EXPORT_SYMBOL_GPL(pci_set_cacheline_size);
2905
2906 /**
2907  * pci_set_mwi - enables memory-write-invalidate PCI transaction
2908  * @dev: the PCI device for which MWI is enabled
2909  *
2910  * Enables the Memory-Write-Invalidate transaction in %PCI_COMMAND.
2911  *
2912  * RETURNS: An appropriate -ERRNO error value on error, or zero for success.
2913  */
2914 int pci_set_mwi(struct pci_dev *dev)
2915 {
2916 #ifdef PCI_DISABLE_MWI
2917         return 0;
2918 #else
2919         int rc;
2920         u16 cmd;
2921
2922         rc = pci_set_cacheline_size(dev);
2923         if (rc)
2924                 return rc;
2925
2926         pci_read_config_word(dev, PCI_COMMAND, &cmd);
2927         if (!(cmd & PCI_COMMAND_INVALIDATE)) {
2928                 dev_dbg(&dev->dev, "enabling Mem-Wr-Inval\n");
2929                 cmd |= PCI_COMMAND_INVALIDATE;
2930                 pci_write_config_word(dev, PCI_COMMAND, cmd);
2931         }
2932         return 0;
2933 #endif
2934 }
2935 EXPORT_SYMBOL(pci_set_mwi);
2936
2937 /**
2938  * pci_try_set_mwi - enables memory-write-invalidate PCI transaction
2939  * @dev: the PCI device for which MWI is enabled
2940  *
2941  * Enables the Memory-Write-Invalidate transaction in %PCI_COMMAND.
2942  * Callers are not required to check the return value.
2943  *
2944  * RETURNS: An appropriate -ERRNO error value on error, or zero for success.
2945  */
2946 int pci_try_set_mwi(struct pci_dev *dev)
2947 {
2948 #ifdef PCI_DISABLE_MWI
2949         return 0;
2950 #else
2951         return pci_set_mwi(dev);
2952 #endif
2953 }
2954 EXPORT_SYMBOL(pci_try_set_mwi);
2955
2956 /**
2957  * pci_clear_mwi - disables Memory-Write-Invalidate for device dev
2958  * @dev: the PCI device to disable
2959  *
2960  * Disables PCI Memory-Write-Invalidate transaction on the device
2961  */
2962 void pci_clear_mwi(struct pci_dev *dev)
2963 {
2964 #ifndef PCI_DISABLE_MWI
2965         u16 cmd;
2966
2967         pci_read_config_word(dev, PCI_COMMAND, &cmd);
2968         if (cmd & PCI_COMMAND_INVALIDATE) {
2969                 cmd &= ~PCI_COMMAND_INVALIDATE;
2970                 pci_write_config_word(dev, PCI_COMMAND, cmd);
2971         }
2972 #endif
2973 }
2974 EXPORT_SYMBOL(pci_clear_mwi);
2975
2976 /**
2977  * pci_intx - enables/disables PCI INTx for device dev
2978  * @pdev: the PCI device to operate on
2979  * @enable: boolean: whether to enable or disable PCI INTx
2980  *
2981  * Enables/disables PCI INTx for device dev
2982  */
2983 void pci_intx(struct pci_dev *pdev, int enable)
2984 {
2985         u16 pci_command, new;
2986
2987         pci_read_config_word(pdev, PCI_COMMAND, &pci_command);
2988
2989         if (enable)
2990                 new = pci_command & ~PCI_COMMAND_INTX_DISABLE;
2991         else
2992                 new = pci_command | PCI_COMMAND_INTX_DISABLE;
2993
2994         if (new != pci_command) {
2995                 struct pci_devres *dr;
2996
2997                 pci_write_config_word(pdev, PCI_COMMAND, new);
2998
2999                 dr = find_pci_dr(pdev);
3000                 if (dr && !dr->restore_intx) {
3001                         dr->restore_intx = 1;
3002                         dr->orig_intx = !enable;
3003                 }
3004         }
3005 }
3006 EXPORT_SYMBOL_GPL(pci_intx);
3007
3008 /**
3009  * pci_intx_mask_supported - probe for INTx masking support
3010  * @dev: the PCI device to operate on
3011  *
3012  * Check if the device dev support INTx masking via the config space
3013  * command word.
3014  */
3015 bool pci_intx_mask_supported(struct pci_dev *dev)
3016 {
3017         bool mask_supported = false;
3018         u16 orig, new;
3019
3020         if (dev->broken_intx_masking)
3021                 return false;
3022
3023         pci_cfg_access_lock(dev);
3024
3025         pci_read_config_word(dev, PCI_COMMAND, &orig);
3026         pci_write_config_word(dev, PCI_COMMAND,
3027                               orig ^ PCI_COMMAND_INTX_DISABLE);
3028         pci_read_config_word(dev, PCI_COMMAND, &new);
3029
3030         /*
3031          * There's no way to protect against hardware bugs or detect them
3032          * reliably, but as long as we know what the value should be, let's
3033          * go ahead and check it.
3034          */
3035         if ((new ^ orig) & ~PCI_COMMAND_INTX_DISABLE) {
3036                 dev_err(&dev->dev, "Command register changed from 0x%x to 0x%x: driver or hardware bug?\n",
3037                         orig, new);
3038         } else if ((new ^ orig) & PCI_COMMAND_INTX_DISABLE) {
3039                 mask_supported = true;
3040                 pci_write_config_word(dev, PCI_COMMAND, orig);
3041         }
3042
3043         pci_cfg_access_unlock(dev);
3044         return mask_supported;
3045 }
3046 EXPORT_SYMBOL_GPL(pci_intx_mask_supported);
3047
3048 static bool pci_check_and_set_intx_mask(struct pci_dev *dev, bool mask)
3049 {
3050         struct pci_bus *bus = dev->bus;
3051         bool mask_updated = true;
3052         u32 cmd_status_dword;
3053         u16 origcmd, newcmd;
3054         unsigned long flags;
3055         bool irq_pending;
3056
3057         /*
3058          * We do a single dword read to retrieve both command and status.
3059          * Document assumptions that make this possible.
3060          */
3061         BUILD_BUG_ON(PCI_COMMAND % 4);
3062         BUILD_BUG_ON(PCI_COMMAND + 2 != PCI_STATUS);
3063
3064         raw_spin_lock_irqsave(&pci_lock, flags);
3065
3066         bus->ops->read(bus, dev->devfn, PCI_COMMAND, 4, &cmd_status_dword);
3067
3068         irq_pending = (cmd_status_dword >> 16) & PCI_STATUS_INTERRUPT;
3069
3070         /*
3071          * Check interrupt status register to see whether our device
3072          * triggered the interrupt (when masking) or the next IRQ is
3073          * already pending (when unmasking).
3074          */
3075         if (mask != irq_pending) {
3076                 mask_updated = false;
3077                 goto done;
3078         }
3079
3080         origcmd = cmd_status_dword;
3081         newcmd = origcmd & ~PCI_COMMAND_INTX_DISABLE;
3082         if (mask)
3083                 newcmd |= PCI_COMMAND_INTX_DISABLE;
3084         if (newcmd != origcmd)
3085                 bus->ops->write(bus, dev->devfn, PCI_COMMAND, 2, newcmd);
3086
3087 done:
3088         raw_spin_unlock_irqrestore(&pci_lock, flags);
3089
3090         return mask_updated;
3091 }
3092
3093 /**
3094  * pci_check_and_mask_intx - mask INTx on pending interrupt
3095  * @dev: the PCI device to operate on
3096  *
3097  * Check if the device dev has its INTx line asserted, mask it and
3098  * return true in that case. False is returned if not interrupt was
3099  * pending.
3100  */
3101 bool pci_check_and_mask_intx(struct pci_dev *dev)
3102 {
3103         return pci_check_and_set_intx_mask(dev, true);
3104 }
3105 EXPORT_SYMBOL_GPL(pci_check_and_mask_intx);
3106
3107 /**
3108  * pci_check_and_unmask_intx - unmask INTx if no interrupt is pending
3109  * @dev: the PCI device to operate on
3110  *
3111  * Check if the device dev has its INTx line asserted, unmask it if not
3112  * and return true. False is returned and the mask remains active if
3113  * there was still an interrupt pending.
3114  */
3115 bool pci_check_and_unmask_intx(struct pci_dev *dev)
3116 {
3117         return pci_check_and_set_intx_mask(dev, false);
3118 }
3119 EXPORT_SYMBOL_GPL(pci_check_and_unmask_intx);
3120
3121 int pci_set_dma_max_seg_size(struct pci_dev *dev, unsigned int size)
3122 {
3123         return dma_set_max_seg_size(&dev->dev, size);
3124 }
3125 EXPORT_SYMBOL(pci_set_dma_max_seg_size);
3126
3127 int pci_set_dma_seg_boundary(struct pci_dev *dev, unsigned long mask)
3128 {
3129         return dma_set_seg_boundary(&dev->dev, mask);
3130 }
3131 EXPORT_SYMBOL(pci_set_dma_seg_boundary);
3132
3133 /**
3134  * pci_wait_for_pending_transaction - waits for pending transaction
3135  * @dev: the PCI device to operate on
3136  *
3137  * Return 0 if transaction is pending 1 otherwise.
3138  */
3139 int pci_wait_for_pending_transaction(struct pci_dev *dev)
3140 {
3141         if (!pci_is_pcie(dev))
3142                 return 1;
3143
3144         return pci_wait_for_pending(dev, pci_pcie_cap(dev) + PCI_EXP_DEVSTA,
3145                                     PCI_EXP_DEVSTA_TRPND);
3146 }
3147 EXPORT_SYMBOL(pci_wait_for_pending_transaction);
3148
3149 static int pcie_flr(struct pci_dev *dev, int probe)
3150 {
3151         u32 cap;
3152
3153         pcie_capability_read_dword(dev, PCI_EXP_DEVCAP, &cap);
3154         if (!(cap & PCI_EXP_DEVCAP_FLR))
3155                 return -ENOTTY;
3156
3157         if (probe)
3158                 return 0;
3159
3160         if (!pci_wait_for_pending_transaction(dev))
3161                 dev_err(&dev->dev, "timed out waiting for pending transaction; performing function level reset anyway\n");
3162
3163         pcie_capability_set_word(dev, PCI_EXP_DEVCTL, PCI_EXP_DEVCTL_BCR_FLR);
3164         msleep(100);
3165         return 0;
3166 }
3167
3168 static int pci_af_flr(struct pci_dev *dev, int probe)
3169 {
3170         int pos;
3171         u8 cap;
3172
3173         pos = pci_find_capability(dev, PCI_CAP_ID_AF);
3174         if (!pos)
3175                 return -ENOTTY;
3176
3177         pci_read_config_byte(dev, pos + PCI_AF_CAP, &cap);
3178         if (!(cap & PCI_AF_CAP_TP) || !(cap & PCI_AF_CAP_FLR))
3179                 return -ENOTTY;
3180
3181         if (probe)
3182                 return 0;
3183
3184         /*
3185          * Wait for Transaction Pending bit to clear.  A word-aligned test
3186          * is used, so we use the conrol offset rather than status and shift
3187          * the test bit to match.
3188          */
3189         if (!pci_wait_for_pending(dev, pos + PCI_AF_CTRL,
3190                                  PCI_AF_STATUS_TP << 8))
3191                 dev_err(&dev->dev, "timed out waiting for pending transaction; performing AF function level reset anyway\n");
3192
3193         pci_write_config_byte(dev, pos + PCI_AF_CTRL, PCI_AF_CTRL_FLR);
3194         msleep(100);
3195         return 0;
3196 }
3197
3198 /**
3199  * pci_pm_reset - Put device into PCI_D3 and back into PCI_D0.
3200  * @dev: Device to reset.
3201  * @probe: If set, only check if the device can be reset this way.
3202  *
3203  * If @dev supports native PCI PM and its PCI_PM_CTRL_NO_SOFT_RESET flag is
3204  * unset, it will be reinitialized internally when going from PCI_D3hot to
3205  * PCI_D0.  If that's the case and the device is not in a low-power state
3206  * already, force it into PCI_D3hot and back to PCI_D0, causing it to be reset.
3207  *
3208  * NOTE: This causes the caller to sleep for twice the device power transition
3209  * cooldown period, which for the D0->D3hot and D3hot->D0 transitions is 10 ms
3210  * by default (i.e. unless the @dev's d3_delay field has a different value).
3211  * Moreover, only devices in D0 can be reset by this function.
3212  */
3213 static int pci_pm_reset(struct pci_dev *dev, int probe)
3214 {
3215         u16 csr;
3216
3217         if (!dev->pm_cap || dev->dev_flags & PCI_DEV_FLAGS_NO_PM_RESET)
3218                 return -ENOTTY;
3219
3220         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &csr);
3221         if (csr & PCI_PM_CTRL_NO_SOFT_RESET)
3222                 return -ENOTTY;
3223
3224         if (probe)
3225                 return 0;
3226
3227         if (dev->current_state != PCI_D0)
3228                 return -EINVAL;
3229
3230         csr &= ~PCI_PM_CTRL_STATE_MASK;
3231         csr |= PCI_D3hot;
3232         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, csr);
3233         pci_dev_d3_sleep(dev);
3234
3235         csr &= ~PCI_PM_CTRL_STATE_MASK;
3236         csr |= PCI_D0;
3237         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, csr);
3238         pci_dev_d3_sleep(dev);
3239
3240         return 0;
3241 }
3242
3243 void pci_reset_secondary_bus(struct pci_dev *dev)
3244 {
3245         u16 ctrl;
3246
3247         pci_read_config_word(dev, PCI_BRIDGE_CONTROL, &ctrl);
3248         ctrl |= PCI_BRIDGE_CTL_BUS_RESET;
3249         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, ctrl);
3250         /*
3251          * PCI spec v3.0 7.6.4.2 requires minimum Trst of 1ms.  Double
3252          * this to 2ms to ensure that we meet the minimum requirement.
3253          */
3254         msleep(2);
3255
3256         ctrl &= ~PCI_BRIDGE_CTL_BUS_RESET;
3257         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, ctrl);
3258
3259         /*
3260          * Trhfa for conventional PCI is 2^25 clock cycles.
3261          * Assuming a minimum 33MHz clock this results in a 1s
3262          * delay before we can consider subordinate devices to
3263          * be re-initialized.  PCIe has some ways to shorten this,
3264          * but we don't make use of them yet.
3265          */
3266         ssleep(1);
3267 }
3268
3269 void __weak pcibios_reset_secondary_bus(struct pci_dev *dev)
3270 {
3271         pci_reset_secondary_bus(dev);
3272 }
3273
3274 /**
3275  * pci_reset_bridge_secondary_bus - Reset the secondary bus on a PCI bridge.
3276  * @dev: Bridge device
3277  *
3278  * Use the bridge control register to assert reset on the secondary bus.
3279  * Devices on the secondary bus are left in power-on state.
3280  */
3281 void pci_reset_bridge_secondary_bus(struct pci_dev *dev)
3282 {
3283         pcibios_reset_secondary_bus(dev);
3284 }
3285 EXPORT_SYMBOL_GPL(pci_reset_bridge_secondary_bus);
3286
3287 static int pci_parent_bus_reset(struct pci_dev *dev, int probe)
3288 {
3289         struct pci_dev *pdev;
3290
3291         if (pci_is_root_bus(dev->bus) || dev->subordinate ||
3292             !dev->bus->self || dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET)
3293                 return -ENOTTY;
3294
3295         list_for_each_entry(pdev, &dev->bus->devices, bus_list)
3296                 if (pdev != dev)
3297                         return -ENOTTY;
3298
3299         if (probe)
3300                 return 0;
3301
3302         pci_reset_bridge_secondary_bus(dev->bus->self);
3303
3304         return 0;
3305 }
3306
3307 static int pci_reset_hotplug_slot(struct hotplug_slot *hotplug, int probe)
3308 {
3309         int rc = -ENOTTY;
3310
3311         if (!hotplug || !try_module_get(hotplug->ops->owner))
3312                 return rc;
3313
3314         if (hotplug->ops->reset_slot)
3315                 rc = hotplug->ops->reset_slot(hotplug, probe);
3316
3317         module_put(hotplug->ops->owner);
3318
3319         return rc;
3320 }
3321
3322 static int pci_dev_reset_slot_function(struct pci_dev *dev, int probe)
3323 {
3324         struct pci_dev *pdev;
3325
3326         if (dev->subordinate || !dev->slot ||
3327             dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET)
3328                 return -ENOTTY;
3329
3330         list_for_each_entry(pdev, &dev->bus->devices, bus_list)
3331                 if (pdev != dev && pdev->slot == dev->slot)
3332                         return -ENOTTY;
3333
3334         return pci_reset_hotplug_slot(dev->slot->hotplug, probe);
3335 }
3336
3337 static int __pci_dev_reset(struct pci_dev *dev, int probe)
3338 {
3339         int rc;
3340
3341         might_sleep();
3342
3343         rc = pci_dev_specific_reset(dev, probe);
3344         if (rc != -ENOTTY)
3345                 goto done;
3346
3347         rc = pcie_flr(dev, probe);
3348         if (rc != -ENOTTY)
3349                 goto done;
3350
3351         rc = pci_af_flr(dev, probe);
3352         if (rc != -ENOTTY)
3353                 goto done;
3354
3355         rc = pci_pm_reset(dev, probe);
3356         if (rc != -ENOTTY)
3357                 goto done;
3358
3359         rc = pci_dev_reset_slot_function(dev, probe);
3360         if (rc != -ENOTTY)
3361                 goto done;
3362
3363         rc = pci_parent_bus_reset(dev, probe);
3364 done:
3365         return rc;
3366 }
3367
3368 static void pci_dev_lock(struct pci_dev *dev)
3369 {
3370         pci_cfg_access_lock(dev);
3371         /* block PM suspend, driver probe, etc. */
3372         device_lock(&dev->dev);
3373 }
3374
3375 /* Return 1 on successful lock, 0 on contention */
3376 static int pci_dev_trylock(struct pci_dev *dev)
3377 {
3378         if (pci_cfg_access_trylock(dev)) {
3379                 if (device_trylock(&dev->dev))
3380                         return 1;
3381                 pci_cfg_access_unlock(dev);
3382         }
3383
3384         return 0;
3385 }
3386
3387 static void pci_dev_unlock(struct pci_dev *dev)
3388 {
3389         device_unlock(&dev->dev);
3390         pci_cfg_access_unlock(dev);
3391 }
3392
3393 /**
3394  * pci_reset_notify - notify device driver of reset
3395  * @dev: device to be notified of reset
3396  * @prepare: 'true' if device is about to be reset; 'false' if reset attempt
3397  *           completed
3398  *
3399  * Must be called prior to device access being disabled and after device
3400  * access is restored.
3401  */
3402 static void pci_reset_notify(struct pci_dev *dev, bool prepare)
3403 {
3404         const struct pci_error_handlers *err_handler =
3405                         dev->driver ? dev->driver->err_handler : NULL;
3406         if (err_handler && err_handler->reset_notify)
3407                 err_handler->reset_notify(dev, prepare);
3408 }
3409
3410 static void pci_dev_save_and_disable(struct pci_dev *dev)
3411 {
3412         pci_reset_notify(dev, true);
3413
3414         /*
3415          * Wake-up device prior to save.  PM registers default to D0 after
3416          * reset and a simple register restore doesn't reliably return
3417          * to a non-D0 state anyway.
3418          */
3419         pci_set_power_state(dev, PCI_D0);
3420
3421         pci_save_state(dev);
3422         /*
3423          * Disable the device by clearing the Command register, except for
3424          * INTx-disable which is set.  This not only disables MMIO and I/O port
3425          * BARs, but also prevents the device from being Bus Master, preventing
3426          * DMA from the device including MSI/MSI-X interrupts.  For PCI 2.3
3427          * compliant devices, INTx-disable prevents legacy interrupts.
3428          */
3429         pci_write_config_word(dev, PCI_COMMAND, PCI_COMMAND_INTX_DISABLE);
3430 }
3431
3432 static void pci_dev_restore(struct pci_dev *dev)
3433 {
3434         pci_restore_state(dev);
3435         pci_reset_notify(dev, false);
3436 }
3437
3438 static int pci_dev_reset(struct pci_dev *dev, int probe)
3439 {
3440         int rc;
3441
3442         if (!probe)
3443                 pci_dev_lock(dev);
3444
3445         rc = __pci_dev_reset(dev, probe);
3446
3447         if (!probe)
3448                 pci_dev_unlock(dev);
3449
3450         return rc;
3451 }
3452
3453 /**
3454  * __pci_reset_function - reset a PCI device function
3455  * @dev: PCI device to reset
3456  *
3457  * Some devices allow an individual function to be reset without affecting
3458  * other functions in the same device.  The PCI device must be responsive
3459  * to PCI config space in order to use this function.
3460  *
3461  * The device function is presumed to be unused when this function is called.
3462  * Resetting the device will make the contents of PCI configuration space
3463  * random, so any caller of this must be prepared to reinitialise the
3464  * device including MSI, bus mastering, BARs, decoding IO and memory spaces,
3465  * etc.
3466  *
3467  * Returns 0 if the device function was successfully reset or negative if the
3468  * device doesn't support resetting a single function.
3469  */
3470 int __pci_reset_function(struct pci_dev *dev)
3471 {
3472         return pci_dev_reset(dev, 0);
3473 }
3474 EXPORT_SYMBOL_GPL(__pci_reset_function);
3475
3476 /**
3477  * __pci_reset_function_locked - reset a PCI device function while holding
3478  * the @dev mutex lock.
3479  * @dev: PCI device to reset
3480  *
3481  * Some devices allow an individual function to be reset without affecting
3482  * other functions in the same device.  The PCI device must be responsive
3483  * to PCI config space in order to use this function.
3484  *
3485  * The device function is presumed to be unused and the caller is holding
3486  * the device mutex lock when this function is called.
3487  * Resetting the device will make the contents of PCI configuration space
3488  * random, so any caller of this must be prepared to reinitialise the
3489  * device including MSI, bus mastering, BARs, decoding IO and memory spaces,
3490  * etc.
3491  *
3492  * Returns 0 if the device function was successfully reset or negative if the
3493  * device doesn't support resetting a single function.
3494  */
3495 int __pci_reset_function_locked(struct pci_dev *dev)
3496 {
3497         return __pci_dev_reset(dev, 0);
3498 }
3499 EXPORT_SYMBOL_GPL(__pci_reset_function_locked);
3500
3501 /**
3502  * pci_probe_reset_function - check whether the device can be safely reset
3503  * @dev: PCI device to reset
3504  *
3505  * Some devices allow an individual function to be reset without affecting
3506  * other functions in the same device.  The PCI device must be responsive
3507  * to PCI config space in order to use this function.
3508  *
3509  * Returns 0 if the device function can be reset or negative if the
3510  * device doesn't support resetting a single function.
3511  */
3512 int pci_probe_reset_function(struct pci_dev *dev)
3513 {
3514         return pci_dev_reset(dev, 1);
3515 }
3516
3517 /**
3518  * pci_reset_function - quiesce and reset a PCI device function
3519  * @dev: PCI device to reset
3520  *
3521  * Some devices allow an individual function to be reset without affecting
3522  * other functions in the same device.  The PCI device must be responsive
3523  * to PCI config space in order to use this function.
3524  *
3525  * This function does not just reset the PCI portion of a device, but
3526  * clears all the state associated with the device.  This function differs
3527  * from __pci_reset_function in that it saves and restores device state
3528  * over the reset.
3529  *
3530  * Returns 0 if the device function was successfully reset or negative if the
3531  * device doesn't support resetting a single function.
3532  */
3533 int pci_reset_function(struct pci_dev *dev)
3534 {
3535         int rc;
3536
3537         rc = pci_dev_reset(dev, 1);
3538         if (rc)
3539                 return rc;
3540
3541         pci_dev_save_and_disable(dev);
3542
3543         rc = pci_dev_reset(dev, 0);
3544
3545         pci_dev_restore(dev);
3546
3547         return rc;
3548 }
3549 EXPORT_SYMBOL_GPL(pci_reset_function);
3550
3551 /**
3552  * pci_try_reset_function - quiesce and reset a PCI device function
3553  * @dev: PCI device to reset
3554  *
3555  * Same as above, except return -EAGAIN if unable to lock device.
3556  */
3557 int pci_try_reset_function(struct pci_dev *dev)
3558 {
3559         int rc;
3560
3561         rc = pci_dev_reset(dev, 1);
3562         if (rc)
3563                 return rc;
3564
3565         pci_dev_save_and_disable(dev);
3566
3567         if (pci_dev_trylock(dev)) {
3568                 rc = __pci_dev_reset(dev, 0);
3569                 pci_dev_unlock(dev);
3570         } else
3571                 rc = -EAGAIN;
3572
3573         pci_dev_restore(dev);
3574
3575         return rc;
3576 }
3577 EXPORT_SYMBOL_GPL(pci_try_reset_function);
3578
3579 /* Do any devices on or below this bus prevent a bus reset? */
3580 static bool pci_bus_resetable(struct pci_bus *bus)
3581 {
3582         struct pci_dev *dev;
3583
3584         list_for_each_entry(dev, &bus->devices, bus_list) {
3585                 if (dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET ||
3586                     (dev->subordinate && !pci_bus_resetable(dev->subordinate)))
3587                         return false;
3588         }
3589
3590         return true;
3591 }
3592
3593 /* Lock devices from the top of the tree down */
3594 static void pci_bus_lock(struct pci_bus *bus)
3595 {
3596         struct pci_dev *dev;
3597
3598         list_for_each_entry(dev, &bus->devices, bus_list) {
3599                 pci_dev_lock(dev);
3600                 if (dev->subordinate)
3601                         pci_bus_lock(dev->subordinate);
3602         }
3603 }
3604
3605 /* Unlock devices from the bottom of the tree up */
3606 static void pci_bus_unlock(struct pci_bus *bus)
3607 {
3608         struct pci_dev *dev;
3609
3610         list_for_each_entry(dev, &bus->devices, bus_list) {
3611                 if (dev->subordinate)
3612                         pci_bus_unlock(dev->subordinate);
3613                 pci_dev_unlock(dev);
3614         }
3615 }
3616
3617 /* Return 1 on successful lock, 0 on contention */
3618 static int pci_bus_trylock(struct pci_bus *bus)
3619 {
3620         struct pci_dev *dev;
3621
3622         list_for_each_entry(dev, &bus->devices, bus_list) {
3623                 if (!pci_dev_trylock(dev))
3624                         goto unlock;
3625                 if (dev->subordinate) {
3626                         if (!pci_bus_trylock(dev->subordinate)) {
3627                                 pci_dev_unlock(dev);
3628                                 goto unlock;
3629                         }
3630                 }
3631         }
3632         return 1;
3633
3634 unlock:
3635         list_for_each_entry_continue_reverse(dev, &bus->devices, bus_list) {
3636                 if (dev->subordinate)
3637                         pci_bus_unlock(dev->subordinate);
3638                 pci_dev_unlock(dev);
3639         }
3640         return 0;
3641 }
3642
3643 /* Do any devices on or below this slot prevent a bus reset? */
3644 static bool pci_slot_resetable(struct pci_slot *slot)
3645 {
3646         struct pci_dev *dev;
3647
3648         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3649                 if (!dev->slot || dev->slot != slot)
3650                         continue;
3651                 if (dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET ||
3652                     (dev->subordinate && !pci_bus_resetable(dev->subordinate)))
3653                         return false;
3654         }
3655
3656         return true;
3657 }
3658
3659 /* Lock devices from the top of the tree down */
3660 static void pci_slot_lock(struct pci_slot *slot)
3661 {
3662         struct pci_dev *dev;
3663
3664         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3665                 if (!dev->slot || dev->slot != slot)
3666                         continue;
3667                 pci_dev_lock(dev);
3668                 if (dev->subordinate)
3669                         pci_bus_lock(dev->subordinate);
3670         }
3671 }
3672
3673 /* Unlock devices from the bottom of the tree up */
3674 static void pci_slot_unlock(struct pci_slot *slot)
3675 {
3676         struct pci_dev *dev;
3677
3678         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3679                 if (!dev->slot || dev->slot != slot)
3680                         continue;
3681                 if (dev->subordinate)
3682                         pci_bus_unlock(dev->subordinate);
3683                 pci_dev_unlock(dev);
3684         }
3685 }
3686
3687 /* Return 1 on successful lock, 0 on contention */
3688 static int pci_slot_trylock(struct pci_slot *slot)
3689 {
3690         struct pci_dev *dev;
3691
3692         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3693                 if (!dev->slot || dev->slot != slot)
3694                         continue;
3695                 if (!pci_dev_trylock(dev))
3696                         goto unlock;
3697                 if (dev->subordinate) {
3698                         if (!pci_bus_trylock(dev->subordinate)) {
3699                                 pci_dev_unlock(dev);
3700                                 goto unlock;
3701                         }
3702                 }
3703         }
3704         return 1;
3705
3706 unlock:
3707         list_for_each_entry_continue_reverse(dev,
3708                                              &slot->bus->devices, bus_list) {
3709                 if (!dev->slot || dev->slot != slot)
3710                         continue;
3711                 if (dev->subordinate)
3712                         pci_bus_unlock(dev->subordinate);
3713                 pci_dev_unlock(dev);
3714         }
3715         return 0;
3716 }
3717
3718 /* Save and disable devices from the top of the tree down */
3719 static void pci_bus_save_and_disable(struct pci_bus *bus)
3720 {
3721         struct pci_dev *dev;
3722
3723         list_for_each_entry(dev, &bus->devices, bus_list) {
3724                 pci_dev_save_and_disable(dev);
3725                 if (dev->subordinate)
3726                         pci_bus_save_and_disable(dev->subordinate);
3727         }
3728 }
3729
3730 /*
3731  * Restore devices from top of the tree down - parent bridges need to be
3732  * restored before we can get to subordinate devices.
3733  */
3734 static void pci_bus_restore(struct pci_bus *bus)
3735 {
3736         struct pci_dev *dev;
3737
3738         list_for_each_entry(dev, &bus->devices, bus_list) {
3739                 pci_dev_restore(dev);
3740                 if (dev->subordinate)
3741                         pci_bus_restore(dev->subordinate);
3742         }
3743 }
3744
3745 /* Save and disable devices from the top of the tree down */
3746 static void pci_slot_save_and_disable(struct pci_slot *slot)
3747 {
3748         struct pci_dev *dev;
3749
3750         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3751                 if (!dev->slot || dev->slot != slot)
3752                         continue;
3753                 pci_dev_save_and_disable(dev);
3754                 if (dev->subordinate)
3755                         pci_bus_save_and_disable(dev->subordinate);
3756         }
3757 }
3758
3759 /*
3760  * Restore devices from top of the tree down - parent bridges need to be
3761  * restored before we can get to subordinate devices.
3762  */
3763 static void pci_slot_restore(struct pci_slot *slot)
3764 {
3765         struct pci_dev *dev;
3766
3767         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3768                 if (!dev->slot || dev->slot != slot)
3769                         continue;
3770                 pci_dev_restore(dev);
3771                 if (dev->subordinate)
3772                         pci_bus_restore(dev->subordinate);
3773         }
3774 }
3775
3776 static int pci_slot_reset(struct pci_slot *slot, int probe)
3777 {
3778         int rc;
3779
3780         if (!slot || !pci_slot_resetable(slot))
3781                 return -ENOTTY;
3782
3783         if (!probe)
3784                 pci_slot_lock(slot);
3785
3786         might_sleep();
3787
3788         rc = pci_reset_hotplug_slot(slot->hotplug, probe);
3789
3790         if (!probe)
3791                 pci_slot_unlock(slot);
3792
3793         return rc;
3794 }
3795
3796 /**
3797  * pci_probe_reset_slot - probe whether a PCI slot can be reset
3798  * @slot: PCI slot to probe
3799  *
3800  * Return 0 if slot can be reset, negative if a slot reset is not supported.
3801  */
3802 int pci_probe_reset_slot(struct pci_slot *slot)
3803 {
3804         return pci_slot_reset(slot, 1);
3805 }
3806 EXPORT_SYMBOL_GPL(pci_probe_reset_slot);
3807
3808 /**
3809  * pci_reset_slot - reset a PCI slot
3810  * @slot: PCI slot to reset
3811  *
3812  * A PCI bus may host multiple slots, each slot may support a reset mechanism
3813  * independent of other slots.  For instance, some slots may support slot power
3814  * control.  In the case of a 1:1 bus to slot architecture, this function may
3815  * wrap the bus reset to avoid spurious slot related events such as hotplug.
3816  * Generally a slot reset should be attempted before a bus reset.  All of the
3817  * function of the slot and any subordinate buses behind the slot are reset
3818  * through this function.  PCI config space of all devices in the slot and
3819  * behind the slot is saved before and restored after reset.
3820  *
3821  * Return 0 on success, non-zero on error.
3822  */
3823 int pci_reset_slot(struct pci_slot *slot)
3824 {
3825         int rc;
3826
3827         rc = pci_slot_reset(slot, 1);
3828         if (rc)
3829                 return rc;
3830
3831         pci_slot_save_and_disable(slot);
3832
3833         rc = pci_slot_reset(slot, 0);
3834
3835         pci_slot_restore(slot);
3836
3837         return rc;
3838 }
3839 EXPORT_SYMBOL_GPL(pci_reset_slot);
3840
3841 /**
3842  * pci_try_reset_slot - Try to reset a PCI slot
3843  * @slot: PCI slot to reset
3844  *
3845  * Same as above except return -EAGAIN if the slot cannot be locked
3846  */
3847 int pci_try_reset_slot(struct pci_slot *slot)
3848 {
3849         int rc;
3850
3851         rc = pci_slot_reset(slot, 1);
3852         if (rc)
3853                 return rc;
3854
3855         pci_slot_save_and_disable(slot);
3856
3857         if (pci_slot_trylock(slot)) {
3858                 might_sleep();
3859                 rc = pci_reset_hotplug_slot(slot->hotplug, 0);
3860                 pci_slot_unlock(slot);
3861         } else
3862                 rc = -EAGAIN;
3863
3864         pci_slot_restore(slot);
3865
3866         return rc;
3867 }
3868 EXPORT_SYMBOL_GPL(pci_try_reset_slot);
3869
3870 static int pci_bus_reset(struct pci_bus *bus, int probe)
3871 {
3872         if (!bus->self || !pci_bus_resetable(bus))
3873                 return -ENOTTY;
3874
3875         if (probe)
3876                 return 0;
3877
3878         pci_bus_lock(bus);
3879
3880         might_sleep();
3881
3882         pci_reset_bridge_secondary_bus(bus->self);
3883
3884         pci_bus_unlock(bus);
3885
3886         return 0;
3887 }
3888
3889 /**
3890  * pci_probe_reset_bus - probe whether a PCI bus can be reset
3891  * @bus: PCI bus to probe
3892  *
3893  * Return 0 if bus can be reset, negative if a bus reset is not supported.
3894  */
3895 int pci_probe_reset_bus(struct pci_bus *bus)
3896 {
3897         return pci_bus_reset(bus, 1);
3898 }
3899 EXPORT_SYMBOL_GPL(pci_probe_reset_bus);
3900
3901 /**
3902  * pci_reset_bus - reset a PCI bus
3903  * @bus: top level PCI bus to reset
3904  *
3905  * Do a bus reset on the given bus and any subordinate buses, saving
3906  * and restoring state of all devices.
3907  *
3908  * Return 0 on success, non-zero on error.
3909  */
3910 int pci_reset_bus(struct pci_bus *bus)
3911 {
3912         int rc;
3913
3914         rc = pci_bus_reset(bus, 1);
3915         if (rc)
3916                 return rc;
3917
3918         pci_bus_save_and_disable(bus);
3919
3920         rc = pci_bus_reset(bus, 0);
3921
3922         pci_bus_restore(bus);
3923
3924         return rc;
3925 }
3926 EXPORT_SYMBOL_GPL(pci_reset_bus);
3927
3928 /**
3929  * pci_try_reset_bus - Try to reset a PCI bus
3930  * @bus: top level PCI bus to reset
3931  *
3932  * Same as above except return -EAGAIN if the bus cannot be locked
3933  */
3934 int pci_try_reset_bus(struct pci_bus *bus)
3935 {
3936         int rc;
3937
3938         rc = pci_bus_reset(bus, 1);
3939         if (rc)
3940                 return rc;
3941
3942         pci_bus_save_and_disable(bus);
3943
3944         if (pci_bus_trylock(bus)) {
3945                 might_sleep();
3946                 pci_reset_bridge_secondary_bus(bus->self);
3947                 pci_bus_unlock(bus);
3948         } else
3949                 rc = -EAGAIN;
3950
3951         pci_bus_restore(bus);
3952
3953         return rc;
3954 }
3955 EXPORT_SYMBOL_GPL(pci_try_reset_bus);
3956
3957 /**
3958  * pcix_get_max_mmrbc - get PCI-X maximum designed memory read byte count
3959  * @dev: PCI device to query
3960  *
3961  * Returns mmrbc: maximum designed memory read count in bytes
3962  *    or appropriate error value.
3963  */
3964 int pcix_get_max_mmrbc(struct pci_dev *dev)
3965 {
3966         int cap;
3967         u32 stat;
3968
3969         cap = pci_find_capability(dev, PCI_CAP_ID_PCIX);
3970         if (!cap)
3971                 return -EINVAL;
3972
3973         if (pci_read_config_dword(dev, cap + PCI_X_STATUS, &stat))
3974                 return -EINVAL;
3975
3976         return 512 << ((stat & PCI_X_STATUS_MAX_READ) >> 21);
3977 }
3978 EXPORT_SYMBOL(pcix_get_max_mmrbc);
3979
3980 /**
3981  * pcix_get_mmrbc - get PCI-X maximum memory read byte count
3982  * @dev: PCI device to query
3983  *
3984  * Returns mmrbc: maximum memory read count in bytes
3985  *    or appropriate error value.
3986  */
3987 int pcix_get_mmrbc(struct pci_dev *dev)
3988 {
3989         int cap;
3990         u16 cmd;
3991
3992         cap = pci_find_capability(dev, PCI_CAP_ID_PCIX);
3993         if (!cap)
3994                 return -EINVAL;
3995
3996         if (pci_read_config_word(dev, cap + PCI_X_CMD, &cmd))
3997                 return -EINVAL;
3998
3999         return 512 << ((cmd & PCI_X_CMD_MAX_READ) >> 2);
4000 }
4001 EXPORT_SYMBOL(pcix_get_mmrbc);
4002
4003 /**
4004  * pcix_set_mmrbc - set PCI-X maximum memory read byte count
4005  * @dev: PCI device to query
4006  * @mmrbc: maximum memory read count in bytes
4007  *    valid values are 512, 1024, 2048, 4096
4008  *
4009  * If possible sets maximum memory read byte count, some bridges have erratas
4010  * that prevent this.
4011  */
4012 int pcix_set_mmrbc(struct pci_dev *dev, int mmrbc)
4013 {
4014         int cap;
4015         u32 stat, v, o;
4016         u16 cmd;
4017
4018         if (mmrbc < 512 || mmrbc > 4096 || !is_power_of_2(mmrbc))
4019                 return -EINVAL;
4020
4021         v = ffs(mmrbc) - 10;
4022
4023         cap = pci_find_capability(dev, PCI_CAP_ID_PCIX);
4024         if (!cap)
4025                 return -EINVAL;
4026
4027         if (pci_read_config_dword(dev, cap + PCI_X_STATUS, &stat))
4028                 return -EINVAL;
4029
4030         if (v > (stat & PCI_X_STATUS_MAX_READ) >> 21)
4031                 return -E2BIG;
4032
4033         if (pci_read_config_word(dev, cap + PCI_X_CMD, &cmd))
4034                 return -EINVAL;
4035
4036         o = (cmd & PCI_X_CMD_MAX_READ) >> 2;
4037         if (o != v) {
4038                 if (v > o && (dev->bus->bus_flags & PCI_BUS_FLAGS_NO_MMRBC))
4039                         return -EIO;
4040
4041                 cmd &= ~PCI_X_CMD_MAX_READ;
4042                 cmd |= v << 2;
4043                 if (pci_write_config_word(dev, cap + PCI_X_CMD, cmd))
4044                         return -EIO;
4045         }
4046         return 0;
4047 }
4048 EXPORT_SYMBOL(pcix_set_mmrbc);
4049
4050 /**
4051  * pcie_get_readrq - get PCI Express read request size
4052  * @dev: PCI device to query
4053  *
4054  * Returns maximum memory read request in bytes
4055  *    or appropriate error value.
4056  */
4057 int pcie_get_readrq(struct pci_dev *dev)
4058 {
4059         u16 ctl;
4060
4061         pcie_capability_read_word(dev, PCI_EXP_DEVCTL, &ctl);
4062
4063         return 128 << ((ctl & PCI_EXP_DEVCTL_READRQ) >> 12);
4064 }
4065 EXPORT_SYMBOL(pcie_get_readrq);
4066
4067 /**
4068  * pcie_set_readrq - set PCI Express maximum memory read request
4069  * @dev: PCI device to query
4070  * @rq: maximum memory read count in bytes
4071  *    valid values are 128, 256, 512, 1024, 2048, 4096
4072  *
4073  * If possible sets maximum memory read request in bytes
4074  */
4075 int pcie_set_readrq(struct pci_dev *dev, int rq)
4076 {
4077         u16 v;
4078
4079         if (rq < 128 || rq > 4096 || !is_power_of_2(rq))
4080                 return -EINVAL;
4081
4082         /*
4083          * If using the "performance" PCIe config, we clamp the
4084          * read rq size to the max packet size to prevent the
4085          * host bridge generating requests larger than we can
4086          * cope with
4087          */
4088         if (pcie_bus_config == PCIE_BUS_PERFORMANCE) {
4089                 int mps = pcie_get_mps(dev);
4090
4091                 if (mps < rq)
4092                         rq = mps;
4093         }
4094
4095         v = (ffs(rq) - 8) << 12;
4096
4097         return pcie_capability_clear_and_set_word(dev, PCI_EXP_DEVCTL,
4098                                                   PCI_EXP_DEVCTL_READRQ, v);
4099 }
4100 EXPORT_SYMBOL(pcie_set_readrq);
4101
4102 /**
4103  * pcie_get_mps - get PCI Express maximum payload size
4104  * @dev: PCI device to query
4105  *
4106  * Returns maximum payload size in bytes
4107  */
4108 int pcie_get_mps(struct pci_dev *dev)
4109 {
4110         u16 ctl;
4111
4112         pcie_capability_read_word(dev, PCI_EXP_DEVCTL, &ctl);
4113
4114         return 128 << ((ctl & PCI_EXP_DEVCTL_PAYLOAD) >> 5);
4115 }
4116 EXPORT_SYMBOL(pcie_get_mps);
4117
4118 /**
4119  * pcie_set_mps - set PCI Express maximum payload size
4120  * @dev: PCI device to query
4121  * @mps: maximum payload size in bytes
4122  *    valid values are 128, 256, 512, 1024, 2048, 4096
4123  *
4124  * If possible sets maximum payload size
4125  */
4126 int pcie_set_mps(struct pci_dev *dev, int mps)
4127 {
4128         u16 v;
4129
4130         if (mps < 128 || mps > 4096 || !is_power_of_2(mps))
4131                 return -EINVAL;
4132
4133         v = ffs(mps) - 8;
4134         if (v > dev->pcie_mpss)
4135                 return -EINVAL;
4136         v <<= 5;
4137
4138         return pcie_capability_clear_and_set_word(dev, PCI_EXP_DEVCTL,
4139                                                   PCI_EXP_DEVCTL_PAYLOAD, v);
4140 }
4141 EXPORT_SYMBOL(pcie_set_mps);
4142
4143 /**
4144  * pcie_get_minimum_link - determine minimum link settings of a PCI device
4145  * @dev: PCI device to query
4146  * @speed: storage for minimum speed
4147  * @width: storage for minimum width
4148  *
4149  * This function will walk up the PCI device chain and determine the minimum
4150  * link width and speed of the device.
4151  */
4152 int pcie_get_minimum_link(struct pci_dev *dev, enum pci_bus_speed *speed,
4153                           enum pcie_link_width *width)
4154 {
4155         int ret;
4156
4157         *speed = PCI_SPEED_UNKNOWN;
4158         *width = PCIE_LNK_WIDTH_UNKNOWN;
4159
4160         while (dev) {
4161                 u16 lnksta;
4162                 enum pci_bus_speed next_speed;
4163                 enum pcie_link_width next_width;
4164
4165                 ret = pcie_capability_read_word(dev, PCI_EXP_LNKSTA, &lnksta);
4166                 if (ret)
4167                         return ret;
4168
4169                 next_speed = pcie_link_speed[lnksta & PCI_EXP_LNKSTA_CLS];
4170                 next_width = (lnksta & PCI_EXP_LNKSTA_NLW) >>
4171                         PCI_EXP_LNKSTA_NLW_SHIFT;
4172
4173                 if (next_speed < *speed)
4174                         *speed = next_speed;
4175
4176                 if (next_width < *width)
4177                         *width = next_width;
4178
4179                 dev = dev->bus->self;
4180         }
4181
4182         return 0;
4183 }
4184 EXPORT_SYMBOL(pcie_get_minimum_link);
4185
4186 /**
4187  * pci_select_bars - Make BAR mask from the type of resource
4188  * @dev: the PCI device for which BAR mask is made
4189  * @flags: resource type mask to be selected
4190  *
4191  * This helper routine makes bar mask from the type of resource.
4192  */
4193 int pci_select_bars(struct pci_dev *dev, unsigned long flags)
4194 {
4195         int i, bars = 0;
4196         for (i = 0; i < PCI_NUM_RESOURCES; i++)
4197                 if (pci_resource_flags(dev, i) & flags)
4198                         bars |= (1 << i);
4199         return bars;
4200 }
4201 EXPORT_SYMBOL(pci_select_bars);
4202
4203 /**
4204  * pci_resource_bar - get position of the BAR associated with a resource
4205  * @dev: the PCI device
4206  * @resno: the resource number
4207  * @type: the BAR type to be filled in
4208  *
4209  * Returns BAR position in config space, or 0 if the BAR is invalid.
4210  */
4211 int pci_resource_bar(struct pci_dev *dev, int resno, enum pci_bar_type *type)
4212 {
4213         int reg;
4214
4215         if (resno < PCI_ROM_RESOURCE) {
4216                 *type = pci_bar_unknown;
4217                 return PCI_BASE_ADDRESS_0 + 4 * resno;
4218         } else if (resno == PCI_ROM_RESOURCE) {
4219                 *type = pci_bar_mem32;
4220                 return dev->rom_base_reg;
4221         } else if (resno < PCI_BRIDGE_RESOURCES) {
4222                 /* device specific resource */
4223                 *type = pci_bar_unknown;
4224                 reg = pci_iov_resource_bar(dev, resno);
4225                 if (reg)
4226                         return reg;
4227         }
4228
4229         dev_err(&dev->dev, "BAR %d: invalid resource\n", resno);
4230         return 0;
4231 }
4232
4233 /* Some architectures require additional programming to enable VGA */
4234 static arch_set_vga_state_t arch_set_vga_state;
4235
4236 void __init pci_register_set_vga_state(arch_set_vga_state_t func)
4237 {
4238         arch_set_vga_state = func;      /* NULL disables */
4239 }
4240
4241 static int pci_set_vga_state_arch(struct pci_dev *dev, bool decode,
4242                                   unsigned int command_bits, u32 flags)
4243 {
4244         if (arch_set_vga_state)
4245                 return arch_set_vga_state(dev, decode, command_bits,
4246                                                 flags);
4247         return 0;
4248 }
4249
4250 /**
4251  * pci_set_vga_state - set VGA decode state on device and parents if requested
4252  * @dev: the PCI device
4253  * @decode: true = enable decoding, false = disable decoding
4254  * @command_bits: PCI_COMMAND_IO and/or PCI_COMMAND_MEMORY
4255  * @flags: traverse ancestors and change bridges
4256  * CHANGE_BRIDGE_ONLY / CHANGE_BRIDGE
4257  */
4258 int pci_set_vga_state(struct pci_dev *dev, bool decode,
4259                       unsigned int command_bits, u32 flags)
4260 {
4261         struct pci_bus *bus;
4262         struct pci_dev *bridge;
4263         u16 cmd;
4264         int rc;
4265
4266         WARN_ON((flags & PCI_VGA_STATE_CHANGE_DECODES) && (command_bits & ~(PCI_COMMAND_IO|PCI_COMMAND_MEMORY)));
4267
4268         /* ARCH specific VGA enables */
4269         rc = pci_set_vga_state_arch(dev, decode, command_bits, flags);
4270         if (rc)
4271                 return rc;
4272
4273         if (flags & PCI_VGA_STATE_CHANGE_DECODES) {
4274                 pci_read_config_word(dev, PCI_COMMAND, &cmd);
4275                 if (decode == true)
4276                         cmd |= command_bits;
4277                 else
4278                         cmd &= ~command_bits;
4279                 pci_write_config_word(dev, PCI_COMMAND, cmd);
4280         }
4281
4282         if (!(flags & PCI_VGA_STATE_CHANGE_BRIDGE))
4283                 return 0;
4284
4285         bus = dev->bus;
4286         while (bus) {
4287                 bridge = bus->self;
4288                 if (bridge) {
4289                         pci_read_config_word(bridge, PCI_BRIDGE_CONTROL,
4290                                              &cmd);
4291                         if (decode == true)
4292                                 cmd |= PCI_BRIDGE_CTL_VGA;
4293                         else
4294                                 cmd &= ~PCI_BRIDGE_CTL_VGA;
4295                         pci_write_config_word(bridge, PCI_BRIDGE_CONTROL,
4296                                               cmd);
4297                 }
4298                 bus = bus->parent;
4299         }
4300         return 0;
4301 }
4302
4303 bool pci_device_is_present(struct pci_dev *pdev)
4304 {
4305         u32 v;
4306
4307         return pci_bus_read_dev_vendor_id(pdev->bus, pdev->devfn, &v, 0);
4308 }
4309 EXPORT_SYMBOL_GPL(pci_device_is_present);
4310
4311 void pci_ignore_hotplug(struct pci_dev *dev)
4312 {
4313         struct pci_dev *bridge = dev->bus->self;
4314
4315         dev->ignore_hotplug = 1;
4316         /* Propagate the "ignore hotplug" setting to the parent bridge. */
4317         if (bridge)
4318                 bridge->ignore_hotplug = 1;
4319 }
4320 EXPORT_SYMBOL_GPL(pci_ignore_hotplug);
4321
4322 #define RESOURCE_ALIGNMENT_PARAM_SIZE COMMAND_LINE_SIZE
4323 static char resource_alignment_param[RESOURCE_ALIGNMENT_PARAM_SIZE] = {0};
4324 static DEFINE_SPINLOCK(resource_alignment_lock);
4325
4326 /**
4327  * pci_specified_resource_alignment - get resource alignment specified by user.
4328  * @dev: the PCI device to get
4329  *
4330  * RETURNS: Resource alignment if it is specified.
4331  *          Zero if it is not specified.
4332  */
4333 static resource_size_t pci_specified_resource_alignment(struct pci_dev *dev)
4334 {
4335         int seg, bus, slot, func, align_order, count;
4336         resource_size_t align = 0;
4337         char *p;
4338
4339         spin_lock(&resource_alignment_lock);
4340         p = resource_alignment_param;
4341         while (*p) {
4342                 count = 0;
4343                 if (sscanf(p, "%d%n", &align_order, &count) == 1 &&
4344                                                         p[count] == '@') {
4345                         p += count + 1;
4346                 } else {
4347                         align_order = -1;
4348                 }
4349                 if (sscanf(p, "%x:%x:%x.%x%n",
4350                         &seg, &bus, &slot, &func, &count) != 4) {
4351                         seg = 0;
4352                         if (sscanf(p, "%x:%x.%x%n",
4353                                         &bus, &slot, &func, &count) != 3) {
4354                                 /* Invalid format */
4355                                 printk(KERN_ERR "PCI: Can't parse resource_alignment parameter: %s\n",
4356                                         p);
4357                                 break;
4358                         }
4359                 }
4360                 p += count;
4361                 if (seg == pci_domain_nr(dev->bus) &&
4362                         bus == dev->bus->number &&
4363                         slot == PCI_SLOT(dev->devfn) &&
4364                         func == PCI_FUNC(dev->devfn)) {
4365                         if (align_order == -1)
4366                                 align = PAGE_SIZE;
4367                         else
4368                                 align = 1 << align_order;
4369                         /* Found */
4370                         break;
4371                 }
4372                 if (*p != ';' && *p != ',') {
4373                         /* End of param or invalid format */
4374                         break;
4375                 }
4376                 p++;
4377         }
4378         spin_unlock(&resource_alignment_lock);
4379         return align;
4380 }
4381
4382 /*
4383  * This function disables memory decoding and releases memory resources
4384  * of the device specified by kernel's boot parameter 'pci=resource_alignment='.
4385  * It also rounds up size to specified alignment.
4386  * Later on, the kernel will assign page-aligned memory resource back
4387  * to the device.
4388  */
4389 void pci_reassigndev_resource_alignment(struct pci_dev *dev)
4390 {
4391         int i;
4392         struct resource *r;
4393         resource_size_t align, size;
4394         u16 command;
4395
4396         /* check if specified PCI is target device to reassign */
4397         align = pci_specified_resource_alignment(dev);
4398         if (!align)
4399                 return;
4400
4401         if (dev->hdr_type == PCI_HEADER_TYPE_NORMAL &&
4402             (dev->class >> 8) == PCI_CLASS_BRIDGE_HOST) {
4403                 dev_warn(&dev->dev,
4404                         "Can't reassign resources to host bridge.\n");
4405                 return;
4406         }
4407
4408         dev_info(&dev->dev,
4409                 "Disabling memory decoding and releasing memory resources.\n");
4410         pci_read_config_word(dev, PCI_COMMAND, &command);
4411         command &= ~PCI_COMMAND_MEMORY;
4412         pci_write_config_word(dev, PCI_COMMAND, command);
4413
4414         for (i = 0; i < PCI_BRIDGE_RESOURCES; i++) {
4415                 r = &dev->resource[i];
4416                 if (!(r->flags & IORESOURCE_MEM))
4417                         continue;
4418                 size = resource_size(r);
4419                 if (size < align) {
4420                         size = align;
4421                         dev_info(&dev->dev,
4422                                 "Rounding up size of resource #%d to %#llx.\n",
4423                                 i, (unsigned long long)size);
4424                 }
4425                 r->flags |= IORESOURCE_UNSET;
4426                 r->end = size - 1;
4427                 r->start = 0;
4428         }
4429         /* Need to disable bridge's resource window,
4430          * to enable the kernel to reassign new resource
4431          * window later on.
4432          */
4433         if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE &&
4434             (dev->class >> 8) == PCI_CLASS_BRIDGE_PCI) {
4435                 for (i = PCI_BRIDGE_RESOURCES; i < PCI_NUM_RESOURCES; i++) {
4436                         r = &dev->resource[i];
4437                         if (!(r->flags & IORESOURCE_MEM))
4438                                 continue;
4439                         r->flags |= IORESOURCE_UNSET;
4440                         r->end = resource_size(r) - 1;
4441                         r->start = 0;
4442                 }
4443                 pci_disable_bridge_window(dev);
4444         }
4445 }
4446
4447 static ssize_t pci_set_resource_alignment_param(const char *buf, size_t count)
4448 {
4449         if (count > RESOURCE_ALIGNMENT_PARAM_SIZE - 1)
4450                 count = RESOURCE_ALIGNMENT_PARAM_SIZE - 1;
4451         spin_lock(&resource_alignment_lock);
4452         strncpy(resource_alignment_param, buf, count);
4453         resource_alignment_param[count] = '\0';
4454         spin_unlock(&resource_alignment_lock);
4455         return count;
4456 }
4457
4458 static ssize_t pci_get_resource_alignment_param(char *buf, size_t size)
4459 {
4460         size_t count;
4461         spin_lock(&resource_alignment_lock);
4462         count = snprintf(buf, size, "%s", resource_alignment_param);
4463         spin_unlock(&resource_alignment_lock);
4464         return count;
4465 }
4466
4467 static ssize_t pci_resource_alignment_show(struct bus_type *bus, char *buf)
4468 {
4469         return pci_get_resource_alignment_param(buf, PAGE_SIZE);
4470 }
4471
4472 static ssize_t pci_resource_alignment_store(struct bus_type *bus,
4473                                         const char *buf, size_t count)
4474 {
4475         return pci_set_resource_alignment_param(buf, count);
4476 }
4477
4478 BUS_ATTR(resource_alignment, 0644, pci_resource_alignment_show,
4479                                         pci_resource_alignment_store);
4480
4481 static int __init pci_resource_alignment_sysfs_init(void)
4482 {
4483         return bus_create_file(&pci_bus_type,
4484                                         &bus_attr_resource_alignment);
4485 }
4486 late_initcall(pci_resource_alignment_sysfs_init);
4487
4488 static void pci_no_domains(void)
4489 {
4490 #ifdef CONFIG_PCI_DOMAINS
4491         pci_domains_supported = 0;
4492 #endif
4493 }
4494
4495 #ifdef CONFIG_PCI_DOMAINS
4496 static atomic_t __domain_nr = ATOMIC_INIT(-1);
4497
4498 int pci_get_new_domain_nr(void)
4499 {
4500         return atomic_inc_return(&__domain_nr);
4501 }
4502
4503 #ifdef CONFIG_PCI_DOMAINS_GENERIC
4504 void pci_bus_assign_domain_nr(struct pci_bus *bus, struct device *parent)
4505 {
4506         static int use_dt_domains = -1;
4507         int domain = of_get_pci_domain_nr(parent->of_node);
4508
4509         /*
4510          * Check DT domain and use_dt_domains values.
4511          *
4512          * If DT domain property is valid (domain >= 0) and
4513          * use_dt_domains != 0, the DT assignment is valid since this means
4514          * we have not previously allocated a domain number by using
4515          * pci_get_new_domain_nr(); we should also update use_dt_domains to
4516          * 1, to indicate that we have just assigned a domain number from
4517          * DT.
4518          *
4519          * If DT domain property value is not valid (ie domain < 0), and we
4520          * have not previously assigned a domain number from DT
4521          * (use_dt_domains != 1) we should assign a domain number by
4522          * using the:
4523          *
4524          * pci_get_new_domain_nr()
4525          *
4526          * API and update the use_dt_domains value to keep track of method we
4527          * are using to assign domain numbers (use_dt_domains = 0).
4528          *
4529          * All other combinations imply we have a platform that is trying
4530          * to mix domain numbers obtained from DT and pci_get_new_domain_nr(),
4531          * which is a recipe for domain mishandling and it is prevented by
4532          * invalidating the domain value (domain = -1) and printing a
4533          * corresponding error.
4534          */
4535         if (domain >= 0 && use_dt_domains) {
4536                 use_dt_domains = 1;
4537         } else if (domain < 0 && use_dt_domains != 1) {
4538                 use_dt_domains = 0;
4539                 domain = pci_get_new_domain_nr();
4540         } else {
4541                 dev_err(parent, "Node %s has inconsistent \"linux,pci-domain\" property in DT\n",
4542                         parent->of_node->full_name);
4543                 domain = -1;
4544         }
4545
4546         bus->domain_nr = domain;
4547 }
4548 #endif
4549 #endif
4550
4551 /**
4552  * pci_ext_cfg_avail - can we access extended PCI config space?
4553  *
4554  * Returns 1 if we can access PCI extended config space (offsets
4555  * greater than 0xff). This is the default implementation. Architecture
4556  * implementations can override this.
4557  */
4558 int __weak pci_ext_cfg_avail(void)
4559 {
4560         return 1;
4561 }
4562
4563 void __weak pci_fixup_cardbus(struct pci_bus *bus)
4564 {
4565 }
4566 EXPORT_SYMBOL(pci_fixup_cardbus);
4567
4568 static int __init pci_setup(char *str)
4569 {
4570         while (str) {
4571                 char *k = strchr(str, ',');
4572                 if (k)
4573                         *k++ = 0;
4574                 if (*str && (str = pcibios_setup(str)) && *str) {
4575                         if (!strcmp(str, "nomsi")) {
4576                                 pci_no_msi();
4577                         } else if (!strcmp(str, "noaer")) {
4578                                 pci_no_aer();
4579                         } else if (!strncmp(str, "realloc=", 8)) {
4580                                 pci_realloc_get_opt(str + 8);
4581                         } else if (!strncmp(str, "realloc", 7)) {
4582                                 pci_realloc_get_opt("on");
4583                         } else if (!strcmp(str, "nodomains")) {
4584                                 pci_no_domains();
4585                         } else if (!strncmp(str, "noari", 5)) {
4586                                 pcie_ari_disabled = true;
4587                         } else if (!strncmp(str, "cbiosize=", 9)) {
4588                                 pci_cardbus_io_size = memparse(str + 9, &str);
4589                         } else if (!strncmp(str, "cbmemsize=", 10)) {
4590                                 pci_cardbus_mem_size = memparse(str + 10, &str);
4591                         } else if (!strncmp(str, "resource_alignment=", 19)) {
4592                                 pci_set_resource_alignment_param(str + 19,
4593                                                         strlen(str + 19));
4594                         } else if (!strncmp(str, "ecrc=", 5)) {
4595                                 pcie_ecrc_get_policy(str + 5);
4596                         } else if (!strncmp(str, "hpiosize=", 9)) {
4597                                 pci_hotplug_io_size = memparse(str + 9, &str);
4598                         } else if (!strncmp(str, "hpmemsize=", 10)) {
4599                                 pci_hotplug_mem_size = memparse(str + 10, &str);
4600                         } else if (!strncmp(str, "pcie_bus_tune_off", 17)) {
4601                                 pcie_bus_config = PCIE_BUS_TUNE_OFF;
4602                         } else if (!strncmp(str, "pcie_bus_safe", 13)) {
4603                                 pcie_bus_config = PCIE_BUS_SAFE;
4604                         } else if (!strncmp(str, "pcie_bus_perf", 13)) {
4605                                 pcie_bus_config = PCIE_BUS_PERFORMANCE;
4606                         } else if (!strncmp(str, "pcie_bus_peer2peer", 18)) {
4607                                 pcie_bus_config = PCIE_BUS_PEER2PEER;
4608                         } else if (!strncmp(str, "pcie_scan_all", 13)) {
4609                                 pci_add_flags(PCI_SCAN_ALL_PCIE_DEVS);
4610                         } else {
4611                                 printk(KERN_ERR "PCI: Unknown option `%s'\n",
4612                                                 str);
4613                         }
4614                 }
4615                 str = k;
4616         }
4617         return 0;
4618 }
4619 early_param("pci", pci_setup);